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@ Hepatitis C Virus Zellkultursystem 

(57) Das erfindungsgemaSe Hepatitis C Virus (HCV) Zellkul- 
tursystem besteht aus humanen Hepatomazellen, die mit 
einem HCV-RNA-Konstrukt transfiziert sind, das die HCV- 
spezifischen RNA-Abschnitte 5'NTR, NS3, NS4A, NS4B, 
NS5A, NS5B und 3*NTR und zudem wenigstens ein selek- 
tierbares Markergen (Selektionsgen) umfafit. 
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Beschrcibung 

Die Erfindung betrifft ein Hepatitis C Virus (HCV) Zellkultursystem, das im wesentlichen eukaryontische Zellen urn- 
faBt, die eingeschleustes HCV-spezifisches Genmaterial enthalten, d. h. die init HCV-spezifischem Genmaterial transfi- 
5 ziert sind. 

Das Hepatitis C Virus (HCV) ist eine der Hauptursachen chronischer und sporadischer Lebererkrankungen weltweit. 
Die meisten HCV-Infektionen verlaufen ohne erkennbare klinische Symptome, allerdings werden 80-90% der Infizier- 
ten dauerhafte Virustrager und bei 50% dieser dauerhaften Virustrager kommt es zu einer chronischen Leberentziindung 
mit unterschiedlichen Schweregraden. Ca, 20% der chronisch Infizierten entwickeln im Laufe von 10 bis 20 Jahren eine 

10 Leberzirrhose, auf deren Basis sich ein primares Leberzellkarzinom entwickeln kann. Die chronische Hepatitis C ist 
heute die Hauptindikation fur eine Lebertransplantation. Eine Kausaltherapie gibt es bisher noch nicht. Die einzige der- 
zeit verfugbare Therapie ist die hochdosierte Vcrabrcichung von Interferon- Alpha oder eine Kombination aus Interferon- 
Alpha und dem Purin-Nukleosidanalogon Ribavirin. Allerdings sprechen nur ca. 60% aller Bchandclten auf diese The- 
rapie an und bei diesen kommt es in mehr als der Halfte aller Falle nach dem Absetzen der Behandlung zu einer erncuten 

15 Viramie. 

Aufgrund der hohen Pravalenz, gerade auch in den Industrielandern, den schwerwiegenden Folgen chronischer Infek- 
tionen und dem Fehlen einer Kausaltherapie ist die Entwicklung einer HCV-spezifischen Chemotherapie ein wesentli- 
ches Ziel der pharmazeutischen Forschung und Entwicklung. Hauptproblem hierbei ist bisher das Fehlen eines geeigne- 
ten Zellkultursystems, das ein Studium der Virus-Replikation und der Pathogenese in eukaryontischen Zellen ermog- 
20 licht. 

Aufgrund der geringen Virusmengen im Blut bzw. Gewebe, dem Fehlen geeigneter Zellkultursysteme oder Tiermo- 
delle (bis heute ist der Schimpanse das einzige mogliche Versuchstier) sowie dem Fehlen efiizienter Systeme zurProduk- 
tion virus-ahnlicher Partikel, konnte die molekulare Zusammensetzung des HCV-Partikels bis heute noch nicht einge- 
hend untersucht bzw. aufgeklart werden. Die derzeit vorliegenden Ergebnisse lassen sich wie folgt zusammenfassen: Das 

25 HCV ist ein umhiilltes Plusstrang RNA Virus mit einem Partikeldurchmcsser von 50-60 nm und einer mittlercn Dichte 
von 1,03-1,1 g/ml. Es wurde erstmals 1989 molekular kloniert und charaktcrisiert (Choo et al, 1989: Science, 244, 
359-362). Die HCV- RNA hat eine Lange von ca. 9.6 kb (= 9600 Nukleotide), cine positive Polaritat und besitzt ein cin- 
ziges offenes Lescrastcr (ORF = open reading frame), das ein lincares Polyprotein von ca. 3010 Aminosaurcn kodiert 
(siehe Rice 1996, in Virology, B.N. Fields, D. M. Knipe, P.M. Howley, Eds. (Lippincott-Raven, Philadelphia, PA, 

30 1 996), vol. 1 , pp. 93 1-960; Clarke 1 997, J. Gen. Virol. 78, 2397; und Bartenschlager 1 997, Intervirology 40, 378 und vgl. 
Fig. 1A), Bei der Virusreplikation wird das Polyprotein durch zellulare und virale Proteasen in die reifen und funktionell 
aktiven Proteine gespalten. 

Innerhalb des Polyproteins sind die Proteine wie folgt angeordnet (vom Amino- zum Carboxyterminus): Core-El-E2- 
p7-NS2-NS3-NS4A-NS4B-NS5A-NS5B. Das Core-Protein ist die Hauptkomponente des Nukleokapsids. Die Glyko- 

35 proteine El und E2 sind Transmembranproteine und Hauptkomponenten der Virushulle. Sie spielen wahrscheinlich bei 
der Anheftung des Virus an die Wirtszelle eine wesentliche Rolle. Diese drei Proteine Core, El und E2 bauen den Vi- 
ruspartikel auf und werden deshalb als Strukturproteine bezeichnct. Die Funktion des Proteins p7 ist noch unklar. Das 
Protein NS2 ist wahrscheinlich die katalytische Domane der NS2-3 Protease, die fiir die Prozesierung zwischen den Pro- 
teinen NS2 und NS3 verantwortlich ist. Das Protein NS3 hat zwei Funktionen, namlich in der aminoterminalen Domane 

40 eine Proteascaktivitat, die fur die Polyproteinprozessicrung cssenticll ist, und in der carboxyterminalen Domane eine 
NTPase/Helikase-Funktion, die wahrscheinlich bei der Replikation der viralen RNA eine Rolle spielt. Das Protein NS4A 
ist ein Kofaktor der NS3-Protease, Die Funktion des Proteins NS4B ist unbekannt. 

Das offene Leseraster ist an seinem STinde von einer ca. 340 Nukleotide langen nichttranslatierten Region (NTR = 
non-translated region) flankiert, die als interne Ribosomenansatzstelle (IRES = internal ribosome entry site) fungiert, und 

45 an seinem 3'Ende von einer ca. 230 Nukleotide langen NTR, die hochstwahrscheinlich fiir die Genomreplikation von Be- 
deutung ist. Eine solche 3*NTR ist Gegenstand der Patenlanmeldung PCT/US 96/14033. Die Strukturproteine in dem 
aminoterminalen Viertel des Polyproteins werden von der Signalpeptidase der Wirtszelle gespalten. Die Nicht-Struktur- 
proteine (NS) 2 bis (NS) 5B werden von zwei viralen Enzymen prozessiert, namlich von der NS2-3 und der NS3/4A Pro- 
teinase. Die NS3/4A Proteinase wird fiir alle Spaltungen jenseits des Carboxyterminus von NS3 benotigt. Die Rolle von 

50 NS4B ist nicht bekannt. NS5A, ein noch phosphoryliertes Protein, scheint fur die Interferon Resistenz verschiedener 
HCV-Gcnotypen verantwortlich zu sein (vgl. Enomoto et al. 1995, J. Clin. Invest. 96, 224; Enomoto et al. 1996, N, Engl. 
J. Med. 334, 77; Gale Jr. et al. 1997, Virology 230, 217; Kanckoet al. 1994, Biochcm. Biophys. Res. Commun. 205, 320; 
Reed et al., 1997, J. Virol. 71, 7187) und NS5B wurde als die RNA-abhangige RNA Polymerase identifiziert. 

Anhand dieser Erkcnntnissc wurden crste Diagnosesystemc entwickclt, die entweder auf dem Nachweis von HCV- 

55 spezifischen Antikorpern in Patientenserum oder auf dem Nachweis von HCV-spezifischer RNA mittels RT-PCR (= Re- 
verse Transcription Polymerase Chain Reaction) beruhen, und die mittlerweile routine- und/oder vorschriftsmaBig bei al- 
ien Blutkonserven angewendet werden (mussen). 

Seit der Erstbeschreibung des Genoms 1989 wurden mit Hilfe der PCR-Melhode zahlreiche Teil- und KomplelLse- 
quenzen des HCV kloniert und charakterisiert. Ein Vergleich dieser Sequenzen zeigt eine hohe Variabilitat des viralen 

60 Genoms, insbesondere im Bereich des NS5B-Gens, was letztendlich zu einer Einteilung in 6 Genotypen gefuhrt hat, die 
selbst nochmals in Subtypen a, b, und c untergliedert sind. Die genomische Varianz ist nicht gleichmaBig Uber das Ge- 
nom verteilt. So sind die 5'NrR und Teile der 3'NTO hoch konserviert, wahrend bestimmte kodierende Sequenzen z. T. 
schr stark variicrcn, vor allem die Hiillprotcine El und E2. 
Die klonierten und charakterisierten Teil- und Komplettsequenzen des HCV-Genoms wurden auBerdem hinsichtlich 

65 geeigneter Angriffsziele fur ein prospektives antivirales Therapeutikum untersucht. Dabei wurden drei virale Enzyme 
gefunden, die sich als solchcs Angriffszicl anbicten. Diese sind (1) der NS3/4A Protcasckomplcx, (2) die NS3 Hclikasc 
und (3) die NS5B RNA-abhangige RNA Polymerase. Der NS3/4A Protcasckomplcx und die NS3 Hclikasc konntcn bc- 
reits kristallisiert und hinsichtlich ihrer dreidimensionalen Struktur aufgeklart werden (Kim et al., 1996, Cell, 87,343; 
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Ycm ct al., 1998, Protein Science, 7, 837; Love et al., 1996, Cell, 87, 311; Kim et al., 1998, Structure, 6, 89; Yao et aL, 
1997, Nature Structural Biology, 4, 463, Cho et al., 1998, J. Biol. Chem., 273, 15045); bei der NS5B RNA-abhangigen 
RNA Polymerase ist dies bis heute noch nicht gelungen. 

Obwohl mit diesen Enzymen bedeutsame Angriffsziele fur eine Therapieentwicklung der chronischen HCV-Infektion 
definiert sind, und obwohl sowohl mit Hilfe von "rational drug design" als auch mil HiLfe von "high throughput screens" 5 
weltweit intensiv nach geeigneten Inhibitoren gesucht wird, leidet die Therapieentwicklung an einem groBen Defizit, 
namlich dem Fehlen von Zellkullursystemen oder einfachen Tiennodellen, die es erlauben, HCV-RNA oder HCV- Anti- 
gene direkt, zuverlassig und mit einfachen laborublichen Methoden nachzuweisen. Das Fehlen solcher Zellkultursy- 
steme ist auch der Hauptgrund dafur, daB das Verstandnis der HCV-Replikation bis heute noch sehr liickenhaft und in 
weiten Teilen nur hypothetisch ist. 10 

Obwohl nach Meinung der Fachwelt eine enge evolutionare Beziehung zwischen HCV und den Flavi- und Pestiviren 
besteht und fur diesc autonom replizicrende RNAs beschrieben sind, die in verschiedcnen Zellinien ohne weiteres zur 
Replikation gebracht werden konnen und dabei relativ hohe Ausbeuten zcigen (siehc Khromykh et al., 1997, J. Virol. 71, 
1497; Behrcns ct al, 1998, J. Virol. 72, 2364; Moser et al., 1998, J. Virol. 72, 5318), waren ahnliche Vcrsuche mit HCV 
bisher nicht erfolgreich. 15 

Zwar ist aus verschiedenen Publikauonen bekannt, daB Zellinien oder primare Zellkulturen mit HCV-haltigem, hoch- 
titrigem Patientenserum infiziert werden konnen, (Lanford et al. 1994, Virology 202, 606; Shimizu et al. 1993, Proce- 
dings of the National Academy of Sciences, USA, 90, 6037-6041; Mizutani et al. 1996, Journal of Virology, 70, 
7219-7223; M. Ikeda et al. 1998, Virus Res. 56, 157; Fournier et al. 1998, J. Gen. Virol. 79, 2376 und darin zitierte Li- 
teraturstellen, Ito et al. 1996, Journal of General Virology, 77, 1043-1054), diese virusinfizierten Zellinien oder Zellkul- 20 
turen erlauben jedoch nicht den direkten Nachweis von HCV-RNA oder HCV-Antigenen. Die virale RNA in diesen Zel- 
len ist weder in einem Northern-Blot (einem Standardverfahren zum quantitativen Nachweis von RNA) noch sind die vi- 
ralen Protein in einem Western-Blot oder mittels Immunprazipitation detektierbar. Nur mit sehr aufwendigen und indi- 
rekten Methoden ist es uberhaupt gelungen, eine HCV-Replikation nachzuweisen. Diese nachteiligen Umstande zeigen 
klar, daB die Replikation in diesen bckannten virusinfizierten Zellinien oder Zellkulturen absolut unzureichcnd ist. 25 

Desweiteren ist aus den Publikationen von Yoo ct al. (1995, Journal of Virology, 69, 32-38) und von Dash et al., 
(1997, American Journal of Pathology, 151, 363-373) bekannt, daB Hepatomazellinien mit synthetischer HCV-RNA, die 
mittels in vitro TVanskription von klonicrtem HCV-Genom gcwonncn wurdc, transfiziert werden konnen. In beidcn Pu- 
blikationen gingen die Autoren von dem Grundgedanken aus, daB das virale HCV-Genom eine Plusstrang-RNA ist, die 
nach dem Einschleusen in die Zelle direkt als rnRNA fungiert, an die sich Ribosomen anheften und im Zuge von Trans- 30 
lationsprozessen Virusproteine bilden, aus denen sich letztendlich neue HCV-Parlikel bilden (konnen). Diese Virusrepli- 
kation, d. h. diese neu gebildeten HCV-Viren bzw. deren RNA wurde mittels RT-PCR nachgewiesen. Die publizierten Er- 
gebnisse der durchgefuhrten RT-PCR sprechen jedoch dafur, daB die Effizienz der HCV-ReplikaUon in den beschriebe- 
nen HCV-transfizierten Hepatomazellen nur sehr gering ist und jedenfalls nicht ausreichl, uin Schwankungen in der Re- 
plikationsrate nach gezielter Einwirkung mit prospektiven anti viralen Therapeutika auch nur qualitativ, geschweige denn 35 
quantitativ zu messen. 

Aufgabe der vorliegendcn Erfindung ist die Bercitstcllung cines HCV-Zellkultursystcms, bei dem die virale RNA in 
den transfizierten Zellen autonom und mit so hoher Effizienz repliziert, daB Schwankungen in der Replikationsrate nach 
gezielter Einwirkung mit virus- und insbesondcre HCV-spezifischen prospektiven antiviralcn Therapeutika qualitativ 
und quantitativ und mit Hilfe gangigcr, laboriiblichcr McBverfahrcn gemcssen werden konnen. 40 

Eine Losung dieser Aufgabe besteht in der Bereitstellung eines Zellkultursystems der eingangs genannten Art, bei 
dem die eukaryontischen Zellen humane Hepatomazellen sind, die vorzugsweise von einer handelsiiblichen Hepatoma- 
zellinie abstammen, aber auch aus einer entsprechenden Primarzellkultur gewonnen sein konnen, und bei dem das ein- 
geschleuste HCV-spezifische Genmaterial ein HCV-RNA-Konstrukt ist, das die HCV-spezifischen RNA-Abschnitte 
5'NTR, NS3, NS4A, NS4B, NS5A, NS5B und 3TJTR, vorzugsweise in der genannten Reihenfolge, und zudem wenig- 45 
stens ein selektierbares Markergen (Selektionsgen) uinfaBt. 

"NTR" steht hier und im folgenden fur "nicht translatierte Region" und ist dem einschlagigen Fachmann als Begriff 
bzw. Abkiirzung bekannt und gelaufig. 

Der Begriff "HCV-RNA-Konstrukt" umfaBt hier und im folgenden sowohl Konstrukte, die das komplette HCV-Ge- 
nom enthalten, als auch solche, die lediglich einen leil davon, d. h. ein HCV-Subgenom enthalten. 50 

Eine bevorzugtc Variantc des crfindungsgemaBen Zellkultursystems, die sich in der Praxis sehr gut bewahrt hat, tragt 
ist unter der Nummer DSM ACC2394 (Laborbczcichnung HuBl 9-13) bei der DSMZ, Deutsche Sammlung von Mi- 
kroorganismen und Zellkulturen GmbH in Braunschweig, Dcutschland, hinterlegt. 

Mit dem crfindungsgemaBen Zellkultursystcm wird erstmals ein in-vitro-System bereit gestellt, in dem HCV-RNA in- 
tracellular, autonom und in ausreichend groBen Mengen repliziert und exprimiert wird, so daB eine quantitative Bestim- 55 
mung sowohl der HCV-RNA-Mengen als auch der HCV-spezifischen Proteine mit konventionellen und zuverlassig ge- 
nauen biochemischen MeBmethoden durchgefiihrt werden kann. Das heiBl: es steht erstmals ein annahemd aulhenlisches 
zellgestutzles ("cell-based") HCV-Replikationssystem zur Verfugung, das fur die Entwicklung und Erprobung von anti- 
viralen Pharmazeutika dringend bendtigt wird. Dieses Teslsystem bietet nun die Moglichkeil, potentielle Angriffsziele 
fiir eine wirksame HCV-spezifische Therapie zu identifizieren und HCV-spezifische Chemolherdpeutika zu entwickeln 60 
und zu evaluieren. 

Die Erfindung basiert auf der uberraschenden Erkenntnis, daB eine efliziente Replikation der HCV-RNA nur dann in 
Zcllcn stattfindct, wenn diese mit einem HCV-RNA-Konstrukt transfiziert wurden, das mindestens die 5' und die 3' nicht- 
translatierten Regionen (NTR) und die Nichtstrukturproteine (NS) 3 bis 5B umfaBt und zusatzlich ein selektierbares 
Markergen (Selektionsgen) aufweist. Offensichtlich sind die Strukturgene fiir den Ablauf der Replikation ohne wesent- 65 
lichc Bcdcutung, wahrend andcrcrscits cine effizicnte Replikation der HCV-RNA anschcinend nur dann stattfindct, wenn 
die transfizierten Zcllcn einem pcrmancntcn Sclcktionsdruck untcrzogen werden, der durch das mit der HCV-RNA vcr- 
bundene selektierbare Markergen (Selektionsgen) vermittelt wird. Das Markergen (Selektionsgen) scheint somit einer- 
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seits die Sclcktion derjenigen Zellen zu provozieren, in dencn die HCV-RNA produktiv repliziert, und andcrerscits 
scheint es die Effizienz der RNA-Replikation wesentlich zu steigern. 

Gegenstand der Erfindung ist auch ein zellfreies HCV-RNA-Konstrukt, das sich dadurch auszeichnet, daB es die HCV- 
spezifischen RNA-Abschnitte 5OTR, NS3, NS4A, NS4B, NS5A, NS5B und 3'NTR, vorzugsweise in der genannten Rei- 
5 henfolge, und zudein ein selektierbares Markergen (Seleklionsgen) umfaBt. 

Der Begriff 5'NTR bzw. NS3 bzw. NS4A bzw. NS4B bzw. NS5A bzw. NS5B bzw. 3OTR umfaBt im vorliegenden Zu- 
sainmenhang jede Nukleolidsequenz, die im Stand der Technik als Nukleotidsequenz fur den jeweils betreffenden funk- 
tionellen Abschnitt des HCV-Genoms beschrieben ist. 

Die Bereitsteilung eines solchen HCV-RNA-Konstrukts ermdglicht erstmals eine detaillierte Analyse der HC V-Repii- 
10 kation, -Pathogenesis und -Evolution in Zellkulturen. Die HCV-spezifische virale RNA kann - als vollstandiges Genom 
oder als Subgenom - gezielt in beliebigen Mengen erzeugt werden, und es besteht die Moglichkeit, das RNA-Konstrukt 
zu manipulieren und damit die HCV-Funktionen auf genetischer Ebcne zu untcrsuchen und aufzuklaren. 

Da alle zur Zcit als Hauptangriffsziel fur eine Therapie untersuchten HC V-Enzyme, namlich die NS3/4A Protease, die 
NS3 Helikase und die NS5B Polymerase, in dem erfindungsgemafien HCV- RNA-Konstrukt enthalten sind, kann es fur 
15 alle entsprechenden Untersuchungen benutzt werden. 

Eine Ausfiihrungsform des HCV-RNA- Konstrukts, die sich in der praktischen Anwendung sehr gut bewahrt hat, 
zeichnet sich dadurch aus, daB sie die Nukleotidsequenz gemaB Sequenzprotokoll SEQ ID NO: 1 umfaBt. 

Weitere Ausfuhrungsvarianten mit vergleichbar guten Eigenschaften fiir den Einsatz in der Praxis sind dadurch ge- 
kennzeichnet, daB sie eine Nukleotidsequenz entweder gemaB Sequenzprotokoll SEQ ED NO: 2 oder gemaB Sequenz- 
20 protokoll SEQ ID NO: 3 oder gemaB Sequenzprotokoll SEQ ID NO: 4 oder gemaB Sequenzprotokoll SEQ ID NO: 5 
umfassen. 

Es besteht die Moglichkeit, das erfindungsgemaBe HCV-Subgenom-Konstrukt nut einer 3*NTR zu versehen, die eine 
im Stand der Technik hierfur bisher unbekannte Nukleotidsequenz aufweist, namlich eine Nukleotidsequenz, die aus der 
Gruppe der nachfolgend aufgelisteten Nukleou'dsequenzen (a) bis (i) ausgewahlt ist: 




GCTTTTTTTTTTTTCTTTTTTTTTGAGAGAGAGAGTCTCACTCTGTTGCCC 
AGACTGGAGT 

(b) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTC TTTTTTTTGA GAGAGAGAGT CTCACTCTGT 
TGCCCAGACT GGAGC 

(c) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 

TTT AATCTTT TTTTTTTTCT TTTTTTTTGA GAGAGAGAGT CTCACTCTGT 
TGCCCAGACT GCAGC 

(d) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTAGTC TTTTTTTTTT TCTTTTTTTT TGAGAGAGAG AGTCTCACTC 
TGTTGCCCAG ACTGGAGT 

(e) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT TCTTTTTTTT TGAGAGAGAG AGTCTCACTC 
TGTTGCCCAG ACTGGAGT 

(0 ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 

TTTTTAGTCT TTTTTTTTTT TCTTTTTTTT TTGAGAGAGA GAGTCTCACT 
CTGTTGCCCA GACTGGAGT 
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ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT CTTTTTTTTT GAGAGAGAGA 
GTCTCACTCT GTTGCCCAGA CTGGAGT 

ACCKJGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTTAAT CTTTTTTTTT TTTTTCCTTT TTTTGAGAGA 

GAGAGTCTCA CTCTGTTGCC CAGACTGGAG T l0 

ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTAATC TTTTTTTTTT TTTTCTTTTT TTTTTGAGAG 

AGAGAGTCTC ACTCTGTTGC CCAGACTGGA GT is 

Das in den erfindungsgemaBen HCV-RNA-Konstrukten enthaltene selektierbare Markergen (Selektionsgen) ist vor- 
zugsweise ein Resistenzgen, insbesondere eine Antibiotikumresistenzgen. 

Das hat den Vorteil, da8 die niit diesem Konstrukt transfizierten Zellen leicht von den nicht transfizierten Zellen selek- 
tiert werden konnen, indem dem Zellkultunnediuni z. B. im Fall eines Antibiotikumresistenzgens das betrefFende Anti- 20 
biotikum zugegeben wird, Unter "Antibiotikum" wird im vorliegenden Zusammenhang jede Substanz verstanden, die 
die nicht-transfizierten Wirtszellen oder die Zellen, in denen die HCV-RNA nur mil geringer Eflizienz repliziert, am Le- 
ben oder Wachstum hindert, insbesondere Zellgifte wie z. B. Puromycin, Hygromycin, Zeocin, Bleomycin oder Blasti- 
cidin. 

Ein bevorzugtes selcktierbares Markcrgen (Selektionsgen) bzw. Resistenzgen, das sich in der Praxis schr gut bewahrt 25 
hat, ist das Neomycinphosphotransferasegen. 

Eine Alternative zu den Antibiotikumresistenzgenen ist z. B. das Thymidin-Kinase-Gen, mit dem eine HAT-Selckdon 
durchgcfuhrt werden kann. 

Die Position des selektierbaren Markergens (Selektionsgens), bzw. des bevorzugten Resistenzgens bzw. des besonders 
bevorzugten Antibiotikumresistenzgens in dem HCV-RNA-Konstrukt liegt vorzugsweise hinter der HCV 5'NTR, d. h. 30 
strangabwarts der 5'NTR bzw. strangaufwarts des HCV-Leserasters. Denkbar ist aber auch eine Insertion im Bereich der 
3'NTR oder an anderer Stelle des HCV-Genoms oder -Subgenoms, z. B. innerhalb des Polyproteins. 

Bei einer alternativen Ausfiihrungsform des erfindungsgemaBen HCV-RNA-Konstrukts ist das selektierbare Marker- 
gen (Selektionsgen), insbesondere ein Andbiotikumresistenzgen, iiber ein Ribozym bzw. eine Erkennungsstelle fur ein 
Ribozym mit der HCV-RNA bzw. der HCV-Genom- oder -Subgenomsequenz verbunden. 35 

Damit geht der Vorteil einher, daB nach erfolgter Selektion derjenigen Zellen, in denen die HCV-RNA produkdv re- 
pliziert, in den daraus gcwonnenen Zellkloncn das Resistenzgen durch ribozymvermittclte Spaltung von der HCV-Sub- 
genomsequenz abgetrennt werden kann, namlich durch Aktivierung des einklonierten Ribozyms oder, im Fall eines Kon- 
strukts mit einer Erkennungsstelle fiir ein Ribozym, durch Einschleuscn des Ribozyms in die Zellen (z. B. mittels Trans- 
fcktion eines Ribozymkonstrukts oder Infektion mit einem viralcn Expressionsvcktor, in den das entsprcchcndc Ribo- 40 
zym eingesetzt wurde). Auf diese Weise wird ein authentisches HCV-Genom-Konstrukt ohne Resistenzgen erhalten, das 
zur Bildung authentischer infektioser Viruspartikel befahigt ist. 

Eine weitere bevorzugte A usfuh rungs form des erfindungsgemaBen HCV-RNA-Konstrukts zeichnet sich dadurch aus, 
daB das Konstrukt wenigstens ein integriertes Reportergen aufweist. 

Unter Reportergen wird im folgenden jedes Gen verstanden, dessen Anwesenheit sich nach Uberf uhrung in einen Ziel- 45 
organismus leicht und im allgemeinen nut einfachen biochemischen oder auch histochemischen Methoden nachweisen 
laBt, d. h. das fur ein Protein kodiert, welches auch in geringen Mengen einfach und zuverlassig mit den laboriiblichen 
MeBmethoden nachgewiesen und quantifiziert werden kann. 

Diese Variante des HCV-RNA-Konstrukts hat den Vorteil, daB der Umfang der Replikadon dieses Konstrukts anhand 
des Reportergenprodukts einfach und schnell mit laboriiblichen Methoden gemessen werden kann. 50 

Das Reportergen ist vorzugsweise ein Gen aus der Gruppc der Luziferasegene, dem CAT-Gcn (Chloramphenicol- Acc- 
tyl-Transfcrasc-Gcn), dem lacZ-Gcn (bcta-Galaktosidascgen), dem GFP-Gcn (grecn-fluorescence-protein-Gen), dem 
GUS-Gen (Glukuronidasegen) oder dem SEAP-Gen (Sezernerte-Alkalische-Phosphatasc-Gcn). Diese Rcportergenc 
bzw. deren Produktc, namlich die entsprechcnden Reportcrproteinc, konnen z. B. mittels Fluoreszcnz, Chcmilumines- 
zenz, colorimetrisch oder mit Hilfe immunologischer Methoden (z. B. ELTSA) bestimmt werden. 55 

Als Reportergen kommt aber auch ein Surrogatmarkergen in Betracht. Darunter sind in diesem Zusammenhang solche 
Gene zu verstehen, die fiir zellulare Proteine, Nukleinsiiuren oder - allgemein - fur solche Funktionen kodieren, die einer 
von der Virusreplikation abhangigen Variation unterliegen, und die infolgedessen in denjenigen Zellen, in denen sich das 
HCV bzw. das HCV-RNA-Konstrukt vermehrt, entweder reprimiert oder aktiviert werden. Das heiBt: die Reduktion bzw. 
Aktivierung dieser Funktion ist ein Ersatzmarker fiir die Virusreplikation bzw. die Replikadon des HCV-RNA-Kon- 60 
strukts. 

Die Positionen von Reportergen und selektierbarem Markergen (Selekdonsgen) konnen so gewahlt sein, daB ein aus 
den bcidcn Gcnproduktcn gcbildctcs Fusionsprotcin cxprimicrt wird. Hicrbci bcstcht die vorteilhaftc Moglichkcit, daB 
diese beiden Gene so in dem HCV-RNA-Konstrukt angeordnet sind, daB ihre beiden exprimierten Proteine zunachst iiber 
eine Schnittstelle fiir eine Protease (z. B. Ubiquidn) oder iiber ein selbstspaltendes Peptid (z. B. das 2A-Protein der Pi- 65 
cornavircn) fusionicrt sind und erst spatcr protcolydsch wiedcr gctrcnnt werden. 

Ebcnsogut konnen diese beiden Positionen aber auch dcrart gctrcnnt voncinandcr licgen, daB bcidc Gcnproduktc se- 
parat exprimiert werden. (z. B. in der Reihenfolge: Marker- bzw. Resistenzgen - interne Ribosomenbindungsstelle - Re- 
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portergcn). 

Im Fall des Reportergens hat sich eine Ausfuhrungsvariante besonders bewahrt, bei der das Reportergen in das offene 
Leseraster des HCV-Genoms oder -Subgenoms einkloniert ist, und zwar derart, daB es erst nach einer proteolytischen 
Prozessierung in eine aktive Form iiberfuhrt wird. 
5 Das erfindungsgeinaBe Zellkultursystem in alien seinen Variationen kann fur vielfaltige Zwecke eingesetzt werden. 
Diese umfassen: 

- Das Auffinden antiviral wirksamer Substanzen. Dies konnen beispielsweise sein: organische Verbindungen, die 
unmittelbar oder mittelbar in die Virusvermehrung eingreifen (z. B. Inhibitoren der viralen Proteasen, der NS3-He- 

10 likase, der NS5B RNA-abhangigen RNA Polymerase), antisense Oligonukleotide, die an eine beliebige Zicise- 
quenz innerhalb des HCV-RNA-Konstrukts (z. B. die 5*NTR) hybridisieren und unmittelbar oder mittelbar zu einer 
Becinflussung der Virusvermehrung fuhren z. B. auf Grand einer Reduktion der Translation des HCV-Polyprotcins 
oder Ribozyme, die eine beliebige HCV-RNA-Sequenz spalten und damit die Virusreplikation becintrachtigen. 

- Die Evaluierung jeglichcr Art antiviral wirksamer Substanzen in Zellkultur. Solche Substanzen konnen beispicls- 
15 weise mittels "rational drug design" oder "high-throughput screening" am isolierten gereinigten Enzym gefunden 

werden. Unter Evaluierung sind vor allem die Bestimmung der inhibitorischen Eigenschaften der entsprechenden 
Substanz sowie deren Wirkungsmechanismus zu verstehen. 

- Die Identifikation neuer AngrifFsziele, viralen oder zellularen Ursprungs, fur eine HCV-spezifische antivirale 
Therapie. Ist beispielsweise ein zellulares Protein essentiell fiir die Virusreplikation, kann mittels Hemmung dieses 

20 zellularen Proteins die Virusreplikation ebenfalls beeinfluBt werden. Das Auffinden solcher auxiliaren Fakloren ist 

mit dem erfindungsgemaBen System ebenfalls moglich, 

- Der Einsatz fur die Resistenzbestimmung. Es ist anzunehmen, daB auf Grand der hohen Mutationsrate des HCV- 
Genoms Therapieresistenzen auftreten. Solche Resistenzen, die gerade bei der klinischen Zulassung einer Substanz 
von groBer Bedeutung sind, lassen sich mit dem erfindungsgemaBen Zellkultursystem ermitteln. Zellinien in denen 

25 sich das HCV-RNA-Konstrukt bzw. das HCV-Genom oder -Subgenom repliziert, werden mit steigenden Konzen- 
trationen der entsprechenden Substanz inkubiert und die Replikation der viralen RNA wird cntweder anhand eines 
eingebrachten Reporters oder durch qualitative oder quantitative Bestimmung der viralen Nukleinsaurcn oder Pro- 
tcine bcstimmt. Resistenz ist dann gegebcn, wcnn bei normaler Wirkstoffkonzcntration keinc Hemmung der Repli- 
kation zu beobachten ist. Durch Reklonierung der HCV-RNA (z. B. mittels RT-PCR) und Sequenzanalyse konnen 

30 die fiir Therapieresistenz verantwortlichen Nukleotid- bzw. Aminosaureaustausche ermittelt werden. Durch Einklo- 
nieren der/des entsprechenden Austausches in das Ursprangskonstrakt kann deren Kausalitat fiir die Therapieresi- 
stenz bewiesen werden. 

- Die Produktion authentischer Virasproteine (Antigene) fiir die Entwicklung und/oder Evaluierung von Diagno- 
stika. Das erfindungsgemafie Zellkultursystem erlaubt auch die Expression von HCV-Antigenen in Zellkutturen. 

35 Diese Antigene konnen prinzipiell auch fur den Aufbau diagnosdscher Nachweisverfahren eingesetzt werden. 

Das crfindungsgemaBe HCV-RNA-Konstrukt fiir sich genommen kann in alien seinen Variationen ebenfalls fiir viel- 
faltige Zwecke eingesetzt werden. Dazu gehoren vor allem: 

40 - Die Konstraktion attenuiertcr Hepatitis C Viren bzw. HC V-ahnlichcr Partikcl und deren Produktion in Zcllkultu- 

ren: 

Durch zufallige oder gezielt hervorgerufene Mutationen, beispielsweise Punktmutationen, Deletionen oder Insertio- 
nen, konnen attenuierte HCV- oder HCVahnliche Partikel erzeugt werden, d. h. Viren bzw. virusahnliche Partikel 
mit voller Replikationskompetenz aber verringerter bzw. fehlender Pathogenitat. Solche attenuierte HCV- oder 
45 HCV-ahnliche Partikel sind insbesondere als Impfstoff einselzbar. 

- Die Konstraktion von HCV-RNA-Konstrukten mit integrierten Fremdgenen, beispielsweise zur Verwendung als 
leberzellspezifische Genfahren in der Gentherapie. Auf Grand des ausgepragten Leberzelltropismus des HCV und 
der Moglichkeit, Teile des Genoms durch heterologe Sequenzen zu ersetzen, lassen sich HCV-RNA-Konstrukte 
herstellen, bei denen beispielsweise die Strakturproteine durch ein therapeutisch wirksames Gen ersetzt werden. 

50 Das so erhaltene HCV-RNA-Konstrukt wird in Zellen eingeschleust, vorzugsweise mittels 'IVansfektion, die die 
fehlendcn HCV-Funktionen, beispielsweise die Strukturproteinc, konstitutiv oder induzierbar exprimicren. Durch 
diese dem Fachmann unter dem BegrifTder "Transkomplementadon" bekannte Technik lassen sich Viruspartikel cr- 
zeugen, in die das HCV-RNA-Konstrukt cingebaut wird. Die so erhaltenen Partikcl konnen fiir die Infckuon vor- 
zugsweise von Lcberzellen verwendet werden. In diesen wird das therapeutisch wirksamc Frcmdgen zur Expression 

55 gebracht und entfaltet damit seine therapeutische Wirkung. 

- Das Auffinden permissiver Zellen, d. h. Zellen, in denen eine produktive Virusvermehrung erfolgt. Zu diesern 
Zweck wird entweder eines der vorgenannten HCV-RNA-Genomkonstrakte verwendet, das zur Bildung kompletter 
infektioser Viren befahigt ist, oder es wird eines der vorgenannten HCV-Subgenom-Konstrukte eingesetzt, das al- 
lerdings zuniichst gemaB vorgenanntem Beispiel in eine Zellinie transfizierl wird, die die fehlenden Funktionen 

60 konstitutiv oder induzierbar exprimiert. In all diesen Fallen entstehen Viruspartikel, die zusatzlich zur HCV-Se- 

quenz ein Resistenz- und/oder Reportergen tragen. Zum Auffinden von Zellen, in denen das HCV replizieren kann, 
werden diese Zellen mit den so hergestellten Viren infiziert und einer Anubiotikumselektion unterzogen oder, in 
Abhangigkcit vom HCV-RNA-Konstrukt, mittels Nachweis der Expression des Reportergens untcrsucht. Da cine 
Antibioukumresistenz bzw. eine Expression des Reportergens nur dann nachweisbar ist, wenn das HCV-RNA-Kon- 

65 su*ukt repliziert, miissen die so gefundenen Zellen permissiv sein. Auf diese Weise lassen sich nahezu beliebige Zel- 

linien oder primarc Zcllkulturen hinsichdich der Pcrmissivitat tcstcn und auffinden. 

Die Erfindung wird im folgenden anhand von Ausfuhrungsbeispielen und dazugehorigen Figuren naher erlautert. Es 
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zcigen 

Fig. 1A die Struktur eines erfindungsgemaBen HCV-RNA-Konstrukts Ganz oben ist eine schematische Darstellung 
der Struktur des kompletten parentalen HCV-Genoms gegeben mit den Positionen der Gene fur die Spaltungsprodukte 
core, El, E2, p7, NS2, NS3, NS4A, NS4B, NS5A und NS5B innerhalb des Polyproteins, und den 5' und 3' nichtlransla- 
tierten Regionen (5*NTR und 3'NTR) - als Horizontalbalken dargestellt -, und mit den beiden fiir die Erzeugung der Sub- 5 
genom-Konstrukte ausgewahlten Positionen, namlich der Position der "GDD-katalylischen Domane" der NS5B RNA 
Polymerase (GDD) und der Position der 3'Grenze der HCV-IRES (Nukleotidpositionen 1 bis 377 bzw. 1 bis 389) - ober- 
halb des Genomschemas eingezeichnet -. Die Zahlen unterhalb des Genomschemas bezeichnen die entsprechenden Nu- 
kleotidpositionen. 

Darunter sind schematische Darstellungen der Strukturen zweier erfindungsgemaBer, modifizierter HCV-RNA-Kon- to 
strukte (Subgenom) gezeigt, bestehend aus der 5'HCV-IRES, dem Neomycinphosphotransferasegen (Neo R ), der EMCV- 
IRES (E-I) und den HCV Scquenzen von NS2 bzw. NS3 bis zum authentischen 3Ende. Die Position der das NS5B Po- 
lymerase GDD-Motiv umfassenden 10 Aminosauren-Deletion ist jeweils mit einem Dreieck (A) markiert; 

Fig. IB das Ergebnis ciner denaturierenden Formaldehyd-Agarose-Gelelcktrophorese zum Nachweis von repliziertcr 
Plusstrang-RNA in transfizierten subpassagierten Huh-7 Zellklonen. 15 
Die Positionen der HCV-spezifischen RNAs (Pfeile) und der 28S rRNA sind rechts von Spur 12 angegeben, die GroBen 
(Anzahlen der Nukleotide) der RNA-Marker (M) sind links von Spur 1 angegeben; 

Fig. 1C das Ergebnis eines PCR-Tests mit nachfolgendem Southern-Blot zum Nachweis der Abwesenheit von inte- 
grierter Replikon-DNA in den meisten der selektierten Zellklone. 

Spuren 1 und 2 zeigen die Positivkontrollen, Spur 13 die Negativ-Kontrolle. Die Zahlenangaben links der Spur 1 be- 20 
zeichnen die GroBe der Nukleotid-Marker-Molektile; 

Fig. 2A das Ergebnis eines PCR-Tests mit nachfolgendem Southern-Blot zum sensiuven AusschluB integrierter Repli- 
kon-DNA (Plasmid Molekule I 3T 7/NS3-3Vwt) in einem HCV-RNA-Konstrukt-haldgen Zellklon (9-13). 
Die Spuren 7 bis 11 reprasentieren das Ergebnis einer Titration von DNA-Molekiilen des Konstrukts I 3 77/NS3-3ywt ohne 
Zugabe von Gesamt-DNA des Zellklons 9- 1 3 und die Spuren 2-6 reprasentieren die glcichcn Plasmidmolekule mit Zug- 25 
abe von jeweils 1 ug 9-13 DNA vorder PGR (zwecks AusschluB eines Inhibitors der PGR in dcrDNA-Praparation). Spur 
13 reprasentiert die Negativ-Kontrolle (PGR ohne DNA-Sonde). Spur 1 zcigt das Ergebnis, das mit einem ug Gesamt- 
DNA des Zellkons 9-13 crhalten wurde; 

Fig. 2B das Ergebnis eines Northern-Blot-Tests zur Quantifizierung von HCV Plus- und Minusstrang RNA. 
Die Pfeile markieren die Positionen von Replikon-RNA. 30 
Die "plus"- und " minus"- Abgaben bezeichnen die positive (plus) bzw. negative (minus) Polarital der RNA-Kontrollen, 
die auf das Gel aufgetragen wurden. "Minusstrand" und "Plusstrand" bezeichnen die Spezifitat der radioaktiven RNA- 
Sonden; 

Fig. 2C Ergebnis einer Fonnaldehyd-Agarose-Gelelektrophorese nach radioakli ver Markierung der intrazellular repli- 
zierten HC V-RNA zum Nachweis der Resistenz der HCV-RNA-Replikation gegen Dactinomycin; 35 

Fig. 3A Nachweis von HCV-spezifischen Antigenen in den selektierten Zellklonen mittels Immunoprazipitation nach 
mctabolischer Radioaktivmarkierung. 

Die Spuren 7-9 reprasentieren authentische GroBenmarker (die nach transienter Expression eines HCV-RNA-Konstrukts 
in Huh-7-Zellcn erhalten wurden); identifizierte HCV-Protcine sind am linkcn Rand von Spur 1 markiert, die Molckular- 
gewichte (in Kilodalton) sind am rcchten Rand von Spur 9 angegeben; 40 

Fig. 3B Ergebnisse eines Imrnunfluoreszenztests zurn Nachweis der subzellularen Lokalisation von HCV Antigenen; 

Fig. 4 schematische Darstellung der Struktur eines erfindungsgemaBen selektierbaren HCV-RNA-Konstrukts (kom- 
plettes Genom) bestehend aus der 5'HCV-IRES, dem Neomycinphosphotransferasegen (NeoR), einem heterologen 
IRES-Element^ z. B. des Encephalomyocarditisvirus (E-I), dem vollstandigen HCV-Leseraster und der authentischen 
3'NTR; 45 

Fig. 5 schematische Darstellung der Struktur von HCV-RNA-Konslrukten nut inserliertem Anubioukumresistenzgen 
(A) innerhalb der fiir das Polyprotein kodierenden Nukleotidsequenz (monocistronische RNA), und (B) innerhalb der 
3'NTR (bicistronische RNA); 

Fig. 6 schematische Darstellung der Struktur von HC V-RNA- Konstrukten mit insertiertem Reportergen (A) als Teil 
eines HCV-Replikons von NS3 bis NS5B; - das Reporterprotein wird letztendlich durch virale oder durch zellulare Pro- 50 
teasen aus dem Polyprotein gcspalten und das selckticrbarc Markergen (Selektionsgen) bzw. das Resistenzgen durch 
Kontransfektion in die Zcllen einschleust, (B) als Teil eines Fusionsgcns aus Resistenz- und Reportergen (z. B. fur die 
Neomycinphosphotransfcrasc und green fluorescent Protein) (C) als Teil eines Replikons aus Resistenz- und Reportergen 
(z. B. fiir die Neomycinphosphotransfcrasc und das green fluorescent Protein), die iibcr eine Nukleotidsequenz vcrbun- 
den sind, welche fiir eine Aminosauresequenz kodiert (schraffierter Bereich), die von einer Protease gespalten werden 55 
kann oder die iiber eine selbsLspaltende (autokatalytische) Aktivitat verfugt, ( A) als unabhangiges Gen (hier green fluo- 
rescent protein), das von einer eigenen inlemen Ribosomenbindungsstelle (IRES) aus exprimiert wird; - das Resistenz- 
gen (hier: Neomycinphosphotransferase-Gen) wird davon unabhiingig ebenfalls von einer eigenen inlemen Ribosomen- 
bindungsstelle (IRES) aus exprimiert (polycistronisches Konslrukt); 

Fig. 7 schematische Darstellung der Struktur eines HCV-RNA-Konstrukts bei dem das Resistenzgen iiber ein Ribo- 60 
zym bzw. eine Erkennungsstelle fiir ein Ribozym mit der HCV-RNA-Sequenz verbunden ist. 

Die dicken Linien stellen die HCV 5'- und 3'NTRs dar, E-I ist eine heterologe interne Ribosomenbindungsstelle, die fiir 
die Expression des Resistcnzgcns notwendig ist, und das grauc Quadrat stcllt das Ribozym bzw. cine Erkennungsstelle 
fur ein Ribozym dar; 

Fig. 8 schematische Darstellung der Struktur eines HCV-RNA-Konstrukts mit Resistenzgen und integriertem Fremd- 65 
gen. 
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Beispiel 1 

Herstellung von HGV-RNA-Konstrukten 

5 (A) Synthese und Klonierung eines vollstandigen HCV-Konsensusgenoms iiiittels RT-PCR 

Aus der Leber eines chronisch infizierten Palienten wurde das HCV-Genora, d. h. die HCV-RNA wie nachfolgend be- 
schrieben isoliert: 

Aus ca. 100 mg Leber wurde die kornplette RNA gemaB dem Verfahren von Chomczynski und Sacci (1987, Anal. 

10 Biochem. 162, 156) isoliert. Mit 1 ug dieser isolierten RNA wurde eine reverse Transkription mit den Primem A6103. 
(GCTATCAGCCGGTTCATCCACTGC) oder A9413 (CAGGATGGCCTATTGG CCTGGAG) und dem "expand re- 
verse transcriptasc'-System (Bochringer Mannheim, Deutschland) nach den Vorschriften des Herstcllers durchgefuhrt. 
Mit den Produktcn dieser reversen TYanskription (RT) wurde eine Polymerase-Kcttcnrcaktion (PGR = polymerase chain 
reaction) durchgefuhrt, und zwar unter Verwendung des "expand long template"- Systems (Boehringer Mannheim, 

15 Deutschland), wobei der Puffer mit 2% Dimethylsulfoxid-Gehalt eingesetzt wurde. Nach einer Stunde bei 42°C wurde 
1/8 dieses Reaktionsansatzes in einem ersten PCR-Durchgang mit den Primern A6103 und S59 (TGTCTTCACGCA- 
GAAAGCGTCTAG) oder A9413 und 54542 (GATGAGCT CGCCGGGAAGCTGTGC) eingesetzt. Nach 40 Zyklen 
wurde 1/10 dieses Reaktionsansatzes in einem zweiten PGR-Durchgang mit den Primern S59 und A4919 (AGCA- 
GAGGGGGCGTGATAGCACTGG) oder 54542 und A9386 (TTAGCTGGCGG TTCATCGGTTGG) eingesetzt. Nach 

20 30 Zyklen wurden die PGR-Produkte mittels praparativer Agarose-Gel-Elektrophorese gereinigt und die dabei eluierten 
Fragmente wurden in den Vektor pCR2.1 (Invitrogen) oderpBSK II (Stratagene) ligiert. Vier Klone von jedem Fragment 
wurden analysiert und sequenziert, und es wurde eine Konsensus-Sequenz ennittelt. Zu diesem Zweck wurden die DNA- 
Sequenzen miteinander verglichen. Die Positionen, an denen sich die Sequenz eines der Fragmente von den iibrigen un- 
terschied, wurde als unerwiinschte Mutation betrachtet. Im Fall von Mehrdeutigkeiten der Sequenz wurden kurzere sich 

25 iiberlappende PGR-Fragmente der bctreflfenden Region amplifiziert und mehrere Klone sequenziert. Auf diese Wcise 
konnten zahlreichc potentielle Mutationen in jedem Fragment identifizicrt und somiteine isolat-spezifischc Konsensus- 
sequenz etabliert werden. Diese etablierte Konsensussequenz bzw. dieses Gcnom gehort zum weltweit verbrciteten Ge- 
notyp lb. Die nicht translatierte Region am 3'-Ende (= 3*NTR) wurde mittels konvcntioneller PGR crhaltcn, wobei ein 
Antisense-Primer eingesetzt. wurde, der die letzten 24 Nukleotide des im Stand der Technik bekannten "X-tails" (Tanaka 

30 et al., 1995, Biochem. Biophys. Res. Gommun. 215, 744; und Rice, PGT/US 96/14033) abdeckt. Die authentische nicht 
translatierte Region am 5'-Ende (= 5'NTR) strangabwarts vom T7 Promotor wurde mittels PGR erzeugt, wobei zum ei- 
nen ein Oligonukleotid verwendet wurde, das einem verkurzten T7 Promotor (TAA TAG GAG TGA GTA TAG) und den 
ersten 88 Nukleotiden von HGV entspricht, und zum anderen eines der vorgenannten Plasmide eingesetzt wurde, das ei- 
nes der 5'Fragmente des Genoms tragt. Aus den subgenomischen Fragmenten mit der geringsten Anzahl an Nicht-Kon- 

35 sensus-Austauschen wurde ein komplettes HGV-Konsensusgenom zusammengesetzt und in einen modifizierten 
pBR322- Vektor insertiert. Abweichungen von der Konsensussequenz wurden mittels ortsgerichteter Mutagenese ("site- 
directed mutagenesis") beseiugt. Um "run-off'-Transkriptc mit einem authcntischcn 3'Ende herzustellen, wurde die 
3'NTR der Isolate (mit dem Ende TGT) zu AGT modifiziert (gemaB der Sequenz vom Genotyp 3 = Klon "WS" nach Ko- 
lykhalov et al, 1996, J. Virol. 70, 3363) und auBerdem wurde ein zusatzlichcr Nukleotidaustausch an Position 9562 vor- 

40 genommen, um die A:T Basenpaarung in der Haamadelstruktur am 3'Ende der 3'NTR (Kolyhalov et al. ibid.) beizubc- 
halten. Um eine interne Restriktionsstelle fur das Enzym Seal zu beseitigen, wurde ferner ein sog. stiller ("silent") Nu- 
kleotidaustausch vorgenommen. Nach dem Zusammenfugen des Vollangen-Genoms mit passenden 5'- und 3'NTRen 
wurde die kornplette HGV-Sequenz uberpriift. Dabei wurde kein ungewiinschter Nukleotidaustausch gefunden. 
Das auf diese Weise hergestellte HGV-Genom sollte per Definition hepatotrop sein. 

45 

(B) Synthese selektierbarer HGV-Subgenorn-KonsLrukte 

Unter Verwendung des unter (A) beschriebenen Konsensusgenoms wurden HGV-Subgenom-Konstrukte hergestellt, 
die das Antibiotikumresistenzgen Neomycin-Phosphotransferase (NPT) und zwei Sequenzen von internen Ribosomen- 

50 bindungsstellen (IRES) enthalten. Die hierfur angewendeten biochemischen Verfahrenstechniken sind dem Fachmann 
bekannt und gelaufig (siehe: Sambrook, J., E. F. Fritsch, T. Maniatis, 1989, Molecularcloning: a laboratory manual, 2nd 
cd., Gold Spring Harbour Laboratory, Gold Spring Harbor, N. Y.; Ausubel et al. (eds.), 1994, Gurrent Protocols in Mole- 
cular Biology, Vol. 1-3, John Wiley & Sons Inc., New York). Das Antibiotikumresistenzgen wurde unmittclbar hintcr der 
5'NTR insertiert, wodurch eine bicistronische RNA crhaltcn wurde (siehe Fig. 1 A). Ebcnsogut kann das Antibiotikum- 

55 resistenzgen aber auch an anderer Stelle des HGV-Subgenom-Konstrukts insertiert werden, beispielsweise innerhalb der 
fur das Polyprorein kodierenden Nukleotidsequenz, wodurch eine monocistronische RNA erhalten wird (siehe Fig. 5A) 
oder in die 3*NTR (siehe Fig. 5B). Bei den IRES-Elementen handelt es sich zum einen um eine der beiden HGV-IRES- 
Varianten Nukleotide 1-377 oder Nukleotide 1-389, und zum anderen um die IRES des Enzephalomyocarditis Virus, die 
die Translation der HGV Sequenz strangabwarts von den Genen fur NS2 oder NS3 bis zu dem authentischen 3'Ende des 

60 Genoms steuert. 

Die beiden genannten HGV-IRES-Varianten wurden wie folgt ermittelt: 
Auf der Basis von Deletionsanalysen der 3'Grenze der HGV-IRES (Reynolds et al. 1995, EMBO J. 14, 6010) wurden 
vcrschicdcnc Abschnittc der 5'NTR mit dem NPT Gen fusioniert und anhand von Kotransfcktioncn mit einem das T7 
RNA Polymerase Gen enthaltenden Plasmid hinsichtlich der maximalen Anzahl gebildeter Kolonien analysiert. Die be- 

65 sten Ergebnisse wurden mit den HGV Sequenzen von 1-377 und 1-389 erhalten. Da sich das AUG-Startkodon des HGV 
Polyprotcins an Position 342 befindet und somit in der IRES-Scqucnz enthalten ist, kommt es zu einer Fusion von 12 
bzw. 16 Aminosaurcn des HGV-Kapsidprotcins ("Gore-Proteins") mit der Neomycin Phosphotransferase (siehe Fig. 1 A). 
Diese modifizierten HGV-Subgenorn-Konstrukte erhielten dement sprechend die Bezeichnungen I377/NS2-3' (oder 
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I 3 77/NS3-3') und I 389 /NS2-3' (oder l3 89 /NS3-3'). Sic sind in Fig. 1A schematisch dargcstellt. 

Mit in-vitro-Transkripten dieser modifizierlen parentalen HCV-Subgenom-Konstrukte l^/NSl-y (oder I389/NS3-3) 
und l3 89 /NS2-3' (oder l3 8 9/NS3-3') wurden verschiedene Zellinien und Primarzellkulturen von menschlichen Hepatocy- 
ten transfiziert. 

Als parallele Negativ-Kontrolle zu alien TYansfektionsexperimenten wurde zu jedem modifizierten parentalen HCV- 5 
Subgenom-Konstrukt ein enlsprechend modifiziertes aber defektes Subgenom konslruiert, das sich von dem parentalen 
dadurch unterscheidet, da8 es innerhalb des Leserasters eine Deletion von 10 Aminosauren aufweist, die das aktive Zen- 
trum der NS5B RNA Polymerase umfaBt (Behrens et aL, 1996, EMBO J. 15, 12; und Lohmann et al., 19977 Virol 71, 
8416). 

10 

(C) Synthese selektierbarer HCV-Genom-Konstrukte 

Ein NS2-3'Subgenomkonstrukt, das am 5*Ende mit einem Fragment des Luziferascgens und der vollstandigen EMCV- 
IRES verbundcn ist, wurde miuNcoI und Spel restringiert und mittels praparativer Agarosegelclektrophorese gereinigt. 
Der so erhaltene Vektor wurde in einer 3-Faktor Ligation mit einem NcoI/Notl-HCV- Fragment, enlsprechend den Nu- 15 
kleotidpositionen 342 bis 1968 des HCV-Genoms und mit einem Notl/Spel-Fragment, entsprechend den Nukleotidposi- 
tionen 1968-9605 ligiert. Das entstandene Konstrukt, bei dem das vollstandige HCV-Leseraster und die stromab- 
warts dem Luziferasegenfragment und der EMCV-IRES liegen, wurde danach mit Pmel und Spel restringiert und mit 
dem analog restringierten l3 89 /NS3-37wt-Subgenoinkonstrukt- Vektor ligiert, Dieses selektionierbare HCV-Genomkon- 
strukt ist in Fig. 4 dargestellt. 20 

(D) Herstellung von den HCV-RNA-Konstrukten entsprechenden in-vitro-Transkripten 

Die vorstehend beschriebenen gereinigten Plasmid DNAs wurden mit Seal linearisiert und nach Phenol/Chloroform- 
Extraktion und Isopropanol-Prazipitation in cine In-vitro-IVanskriptionsrcaktion eingesctzt unter Vcrwcndung der fol- 25 
genden Komponenten: 80 mM HEPES, pH 7,5, 12,5 mM MgQ 2 , 2 mM Spermidin, 40 mM Dithiothreitol, 2 mM von je- 
dem NTP, 1 Einheit RNasin/pl, 50 ug/ml restringierte DNA und ca. 2 Einhciten/ul T7 RNA Polymerase. Nach 2 Std. bei 
37°C wurde die Halftc der Mengc an T7 Polymerase zugegeben und der Reaktionsansatz wcitcrc 2 h inkubicrt. Zur Ent- 
fernung von DNA wurde die Mischung mit saurem Phenol extrahiert (U. Kedzierski, J. C. Porte, 1991, Bio Techniques 
10, 210), mit Tsopropanol prazipitiert, das Pellet in Wasser gelost und mit DNase (2 Einheiten pro ug DNA) fur 60 Min. 30 
bei 37°C inkubiert. Nach anschheBenderExtrakuon mit saurem Phenol, saurem Phenol/Chloroform und Chloroform und 
Isopropanol-Prazipitation wurde die geloste RNA mittel optischer Dichtemessungen quantifiziert und ihre Unversehrt- 
heit mittels Formaldehyd-Agarose-Gelelektrophorese uberpruft. 

Beispiel 2 35 

Transfektionsexperimente mit der Hepatomazcllinic Huh-7 

Bei samtlichcn Transfckuonsexpcrimcnten wurde sorgfaltig darauf geachtet, daB jegliche Matrizen-DNA zuvor cnt- 
fcrnt worden war, um zu vermciden, daB solche DNA in transfiziertc Zcllen integricrcn und dicsen unabhangig von einer 40 
HCV-Replikation eine Neomycin-Resistenz vermitteln konnte. Deshalb wurde im AnschluB an die in- vitro- TYanskrip- 
tion (Beispiel ID) die Reaktionsmischung mit 2 Einheiten DNase pro ug DNA fur 60 Min. bei 37°C behandelt und mit 
saurem Phenol, saurem Phenol/Chloroform und Chloroform extrahiert. Vor der Verwendung fur die Transfektion wurde 
die prazipitierte RNA mittels Formaldehyd Agarose Gel Elektrophorese analysiert. 

Es wurden drei separate Transfektionsexperimente mit der hoch differenzierten humanen Hepatomazellinie Huh-7 45 
(gemaBNakabayashi etal. 1982, Cancer Res. 42, 3858) durchgefuhrt. Dabei wurde jeweils 15 ugRNAin 8 x l0 6 Huh-7- 
Zellen mit Hilfe der Elektroporation eingebracht und diese Zellen anschlieBend in Kulturschalen von 10 cm Durchmes- 
ser ausgesat. 24 Stunden nach der Aussaat wurde Neomycin (= G418) in einer Endkonzentration von 1 mg/ml zugege- 
ben. Das Kulturmedium wurde zweimal pro Woche gewechselt. Nach 3-5 Wochen waren kleine Kolonien erkennbar, die 
isoliert und unter den gleichen Kulturbedingungen passagiert wurden. 50 

Die Zcllklonc, die im Vcrlauf des ersten Experiments erhalten wurden, wurden isoliert und subpassagiert. Wahrend 
dieser Prozedur starben die mcisten Klone und die Endausbeute betrug nur noch 9 Klone von Zcllen, die mit den paren- 
talen HCV-Subgenom-Konstrukten transfiziert worden warcn und 1 Klon (Klone 8-1) von Zcllen, die mit einem defekten 
HCV-Genom-Konstrukt, namlich einer defekten NS2-3'HCV-RNA transfiziert worden waren. AuBcr cincr vcrkiirzten 
Verdopplungszeit und dem gelegentlichen Auftreten von irregular geformten Zellen wurden keine bestandigen morpho- 55 
logischen Unterschiede zwischen diesen 9 Zel Iklonen und dem ei nen Zellklon (Klon 8- 1 ) oder den parentalen Huh-7 Zel- 
len gefunden. 

Die Hauptkriterien fur funktionierende HCV-Genomkonstrukte sind die Bildung von viralerRNA mit korrekter GroBe 
und die Abwesenheit von (integrierter) Plasmid DNA, die eine G4l8-Resistenz iibertragen bzw. vermitteln konnte. 

Um die HCV-RNA in den Huh-7-Zellen zu bestimmen, wurde die Gesamt-RNA isoliert und mittels des gangigen 60 
Northern-Blot Verfahrens unter Verwendung einer Plusstrang-spezifischen Ribosonde (= RNA-Sonde) analysiert. Hier- 
fur wurde von den jeweiligen Zellklonen Gesamt-RNA nach der Methode von Chomczynski und Sacchi 1987, Anal. 
Biochcm. 162, 156 isoliert, und 10 ug RNA, was dem Gcsamt-RNA-Gchalt von 0,5-1 x l(r Zellen cntspricht, mittels dc- 
naturierender Formaldehyd-Agarose-Gelelektrophorese aufgetrennt (Spuren 3 bis 12 der Fig. IB). Als GrbBenmarker 
mit authentischer Sequenz wurden gleichzeitig 109 in-vitro-'lYanskripte (ivtr.), die zu den l 38 9/NS2-37wt oder den 65 
l3 89 /NS3-37wt Rcplikon-RNAs korrespondicrcn, mit aufgetrennt (Spur 1 bzw. Spur 2). Die aufgetrennte RNA wurde auf 
Nylon-Mcmbranen transfcriert und mit radioaktiv markicrtcr Plusstrang-spczifischcr RNA-Sondc, die komplementar zu 
dem kompletten NPT-Gen und der HCV-TRES von Nukleotid 377 bis Nukleotid 1 war, hybridisiert. Die Positionen der 
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HCV-spezifischen RNAs (Pfeilc) und der 28S rRNA sind rechts von Spur 12 angegeben, die Groficn (Anzahlcn der Nu- 
kleotide) der RNA -Marker sind links von Spur 1 angegeben. Die RNA Marker-Fragmente enthalten HCV-Sequenzen 
und hybridisieren deshalb mit der Ribosonde (= RNA-Sonde). Die Ergebnisse dieser Analyse sind in Fig. IB dargestellt. 
Mit Ausnahme des mit dem defekten HCV-Genom-Konstrukt transfizierten Klons 8-1, lieferten alle Zellklone horno- 

5 gene HCV-RNAs korrekter Lange (ca. 8640 Nukleotide iin Fall des NS2-3' und ca. 7970 Nukleoude im Fall des NS3- 
3*Repbkons). Dieser Befund ist ein Indiz dafur, daB die funklionalen Replikons bzw. die funktionalen HCV-Genom-Kon- 
strukte die G418 Resistenz ubertragen. Um auszuschlieBen, daB die G418 Resistenz auf eine Plasinid-DNA zuriickzu- 
fiihren ist, die in das Genom der Huh-7 Wirtszelle integriert ist und unter der Kontrolle eines zellularen Promotors tran- 
skribiert wird, wurde von jedem Klon die DNA mittels einer NPT-Gen-spezifischen PGR untersucht. Hierbei wurde aus 

to den selektierten Huh-7-Zellklonen die DNA mittels Verdau mit Proteinase K (40 ug/ml, 1 h, 3TQ in 10 mM Tris, 
pH 7,5, 1 mM EDTA, 0,5% SDS und anschlieBender Extraktion mit Phenol, Phenol/Chloroform- und Isopropanolprazi- 
pitation isoliert. Das DNA-Prazipitat wurde in 10 mM Tris (pH 7,5) und 1 mM EDTA gelost und 1 Stunde mit Rnase A 
inkubiert. Im AnschluB an eine Phenol/Chloroform Extraktion und Ethanol Prazipitation wurde 1 ug DNA, entsprechend 
4-8 x 10 4 Zellen, mittels PGR unter Einsatz NPT-Gen-spezifischer Primer (5'-TGAAGAGGGACGTG TCCGGTGCCC- 

15 3' und 5'-GTTGAGGGTGGGGA AC AGTTGGGG-3') analysiert und ein DNA-Fragment bestehend aus 379 Nukleotiden 
erzeugt. Die Spezifitat des PCR-Produkts wurde mittels Southern Blot Verfahren nachgewiesen, wobei ein Digoxigenin- 
markiertes DNA Fragment eingesetzt wurde, das zu dem NPT-Gen korrespondiert. Als Positiv-Kontrollen (zum Nach- 
weis etwa vorhandener kontaminierender Nukleinsauren) wurde das PGR- Verfahren mit 10 7 Plasmid Molekulen oder 
1 ug DNA aus einer BHK Zellinie, die stabil mit einem Neomycin-Resistenz-Gen transfiziert war, durchgefuhrt, und als 

20 Negativ-Kontrolle wurde die PGR mit denselben Reagenzien aber ohne zugesetzte DNA durchgefuhrt. 

Die Ergebnisse dieser Untersuchung sind in Fig. 1G dargestellt. Die Spuren 1 und 2 reprasentieren die Posiuv-Kon- 
trollen, Spur 13 reprasentiert die Negaliv-Konlrolle. Die Zahlenangaben links der Spur 1 bezeichnen die GroBe der Nu- 
kleotid-Marker-Molekule. AuBer in Klon 7-3 (Fig. 1G, Spur 3), der von Zellen nach Transfektion mit einem NS2-3'-Re- 
plikon/NS2-3 , HCV-Genom-Konstrukt stammt, und in Klon 8-1 (Fig. 1G, Spur 12), der von Zellen nach Transfektion mit 

25 einem defekten HGV-Genom-Konstrukt stammt, war in keinem Zellklon eine NPT-DNA nachweisbar. Dieser Befund ist 
ein weiteres Indiz dafur, daB die G418 Resistenz der meisten Klone durch die replizierende HCV-RNA vermittelt wurde. 
Aber auch unabhangig von diescn Ergebnissen ist es unwahrscheinlich, dafi HCV-RNAs mit korrekter GroBe von intc- 
grierter Plasmid DNA erzeugt wird, denn die fur die in-vitro-Transkription verwendcten Plasmide enthalten weder eincn 
eukaryontischen Promotor noch ein Polyadenylierungssignal. Im Fall des Klons 7-3 ist die Resistenz deshalb hochst 

30 wahrscheinlich sowohl durch das HC V-RNA-Konstrukt bzw. die replizierende HCV-RNA als auch durch eine integrierte 
NPT-DNA Sequenz vermittelt worden, wahrend die Resistenz der Zellen von Klon 8-1 ausschlieBlich auf die integrierte 
Plasmid DNA zuriickzufuhren ist. 

Um zu bestatigen, daB die G418 Resistenz von einer autonom replizierenden HCV-RNA vermittelt ist, wurde der Klon 
9-13 (Fig. IB, Spur 11) weiteren Tests unterworfen. Klon 8-1, der integrierte Kopien des NPT-Gens tragi, wurde uberall 

35 als Negativkontrolle eingesetzt. Mit dem Ziel, die Anwesenheit von NPT-DNA im Klon 9-13 rigoros auszuschlieBen, 
wurde eine PGR durchgefuhrt, die den Nachweis von < 1000 NPT-Gen-Kopien in 40.000 Zellen erlaubt. Das Ergebnis 
dieser PGR ist in Fig. 2A dargestellt. Im einzelnen wurde bci dieser PGR wie folgt verfahren: 

Es wurden jeweils lOMO^Plasmid Molekiile (I 37 7/NS3-37wt) entweder direkt (Spuren 7-11) oder nach Zugabe von 
jcweils 1 ug 9-13 DNA (Spuren 2-6) in dem Test eingesetzt. Die Spezifitat der amplifizierten DNA Fragment wurde mit- 

40 tels Southern Blot unter Verwcndung einer NPT-spczifischen Sonde bestimmt. Eine PGR ohne DNA-Sonde wurde als 
Negativ- Kontrolle durchgefuhrt (Spur 12). 

Selbst mit dieser sensitiven Methode wurde in einem ug DNA des Zellklons 9-13 keine Plasmid DNA gefunden (Spur 
1). Um die Menge an HGV Plus- und Minusstrang RNAs in diesen Zellen abzuschatzen, wurde eine Verdiinnungsreihe 
von Gesamt-RNA mit dem Northern-Blot- Verfahren unter Verwendung einer Plus- oder Minusstrang-spezifischen radio- 

45 akliv markierten Ribosonde (= RNA-Sonde) analysiert. Hierfur wurden jeweils 8, 4 oder 2 ug Gesamt-RNA, die aus den 
Zellklonen 9-13 und 8-1 isoliert worden waren, parallel zu bekannten Mengen analoger in-viU*o-Transkripte mit Plus- 
oder Minusstrang-Poiaritat (Kontroll-RNAs) im Northern-Blot- Verfahren analysiert und anschlieBend einer Hybridisie- 
rung unterworfen. Die Hybridisierung wurde mit einer Plusstrang-spezifischen Ribosonde, die das komplette NPT-Gen 
und die HGV-IRES abdeckte ("plusstrand", obere Bildtafel), oder mit einer Minusstrang-spezifischen RNA-Sonde, die 

50 zu der NS3-Sequenz komplementar war ("minusstrand", untere Bildtafel) durchgefuhrt. Die Pfeile markieren die Posi- 
tionen von Rcplikon-RNA. Die Ergebnisse dieser Analyse sind in Fig. 2B dargestellt. 

Im Fall des Plusstrangs wurden ca. 10 8 Kopicn/ug Gesamt-RNA nachgewiesen, was 1000-5000 HCV-RNA-Molcku- 
len pro Zelle entspricht, wahrend die Menge an Minusstrang-RNA 5- bis 10-fach niedriger war. Dieses Ergebnis stimmt 
mit der Annahmc ubercin, daB die Minusstrang RNA die replikativc Zwischenform bzw. Zwischcnkopie ist, die als Vor- 

55 lage fiir die Synthese der Plusstrang Molekiile dient. 

Da die Reaktion im wesentlichen von der viralen RNA-abhangigen RNA Polymerase katalysiert wird, sollte die Syn- 
these der HCV-RNAs resistent gegen Dactinomycin sein, einem Antibiotikum, das selektiv die RNA-Synthese von 
DNA-Malrizen inhibiert, nicht jedoch die RNA-Synthese von RNA-Matrizen. Um diese Vermutung zu bestatigen, wur- 
den Zellen mit [ 3 H] Uridin in Anwesenheit von Dactinomycin inkubiert, die radioaktiv markierten RNAs extrahiert, mi t- 

60 tels denaturierender Agarose-Gel-Elektrophorese aufgelrennt und mit Hilfe eines handelsublichen Bio-Imagers unter 
Verwendung einer | 3 H|-sensitiven Bildplatte analysiert. Hierfur wurden jeweils ca. 5 x 10 5 Zellen der Klone 9-13 und 8- 
1 mit 100 u Gi | 3 H)Uridin fiir 16 Std. in Abwesenheit (-) oder Gegen wart (+) von 4 ug/ml Dactinomycin (Dact) inku- 
biert. Im AnschluB an diese Markicrungsreaktion wurde die Gesamt-RNA praparicrt und mittels Formaldchyd- Agarose- 
Gel-Elektrophorese analysiert. In den beiden ersten Spuren ist nur 1/10 der Gesamt-RNA dargestellt. Die radioaktiv mar- 

65 kierte RNA wurden mit einem BAS-2500 Bio-Imager (Firma Fuji) sichtbar gemacht. 

Die Ergebnisse dieser Analyse sind in Fig. 2G dargestellt. In Ubcrcinsummung mit dem Inhibitor- Profit der NS5B Po- 
lymerase (Bchrcns et al., 1996, EMBOJ. 15, 12 und Lohmann ct al., 1997, J. Virol. 71, 8416) war die Rcplikation der 
HCV-RNA nicht durch Dactinomycin beeinfluBt worden, wahrend die Synthese von zellularer RNA gehemmt worden 
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war. Um die Identitat der viralen RNA zu bcstatigcn, wurde eine RT-PCR zur Reklonierung dcr replizierten Scquenzen 
durchgefuhrt. Die Sequenzanalyse der reklonierten RNA zeigte, daB die RNA in dem Klon 9-13 HCV-spezifisch ist und 
mit dem transfizierten Transkript des HCV-Konstrukts l377/NS3-3Vwt ubereinstimmt. 

Zur Analyse der viralen Proteine wurden die betreffenden Zellen zunachst metabolisch mit [ 35 S] Methionin/Cystein 
radioaktiv markiert, anschlieBend lysiert und danach die HCV-spezifischen Proteine imttels Immunoprazipitation aus 5 
den Zell-Lysaten isoliert. Die Ergebnisse dieser Analysen sind in Fig. 3 A dargestellt. Im einzeinen wurde dabei wie folgt 
verfahren: Zellen der Zellklone 9-13 (wl) und 8- 1 ( A ) waren durch Behandlung fur 16 Stunden mit einer dem Fachmann 
gelaufigen und im Handel erhaltlichen Protein-Markierungs-Mischung (z. B. NEN Life Science) metabolisch radioaktiv 
markiert worden. Mittels Immunoprazipitation (IP) unter nichtdenaturierenden Bedingungen (z. B. nach Bartenschlager 
et al., 1995,-1 Virol. 69, 75 19) und unter Verwcndung von drei verschiedenen Antiseren (3/4, 5 A, 5B, gema'B Markierung 10 
am oberen Ende der Spuren 1 bis 12) waren die HCV-spezifischen Proteine vom Zell-Lysat abgetrennt worden. Die Im- 
munokomplexe wurden mittels Tricine SDS-PAGE analysiert und mittels Autoradiographic sichtbar gemacht. Um au- 
thentische GroBenmarker zu erhalten, wurde das homologe Replikonkonstrukt I 377 /NS3-37wt einer transienten Expres- 
sion mit dem Vaccinia Virus T7-Hybrid System in Huh-7 Zellen unterworfen. Die dabei erhaltenen Produkte waren als 
GroBenmarker (Spuren 7-9) parallel zu den Zellen der Klone 9-13 und 8-1 behandelt worden. Identifizierte HCV-Pro- 15 
teine sind am linken Rand von Spur 1 markiert, die Molekulargewichte (in Kilodalton) sind am rechten Rand von Spur 9 
angegeben. Es ist anzumerken, daB das verwendeteNS3/4-spezifische Antiserum ("3/4") bevorzugt mitNS4A und NS4B 
reagiert, was zu einer Unterreprasentation von NS3 fuhrt. 

Alle viralen Antigene waren eindeutig nachweisbar und ihre apparenten Molekulargewichte zeigten keine Abwei- 
chungen gegenuber denjenigen, die nach transienter Expression desselben bicistronischen HCV-RNA-Konstrukts in den 20 
urspriinglichen Huh-7 Zellen ermittelt wurden. Um die subzellulare Verteilung der viralen Antigene zu bestimmen, 
wurde eine Immunofluoreszenz-Nachweisreaktion unter Einsatz von NS3- und NS5A-spezifischen Antiseren durchge- 
fuhrt (z. B. nach Bartenschlager et al., 1995, J. Virol. 69, 75 19). Hierfiir wurden Zellen der Klone 9-13 (wt) und 8-1 (A) 
24 Std. nach dem Aussaen auf Deckglasem mit Methanol/Azeton fixiert und mit polyklonalen NS3- oder NS5A-spezifi- 
schen Antiseren inkubicrt. Die gebundenen Antikorpcr wurden mit eincm kommerziell erhaltlichen HTC-konjugiertcn 25 
Anti- Kaninchen- Antiserum sichtbar gemacht. Zur Unterdriickung unspezifischer Huoreszenzsignale wurden die Zellen 
mit dem Farbstoff "Evans Blue" gcgengefarbt. 

Die Ergebnisse dieses Nachweistests sind in Fig. 3 B dargestellt. Mit beiden Antiseren war eine starkc Fluoreszenz im 
Zytoplasma nachweisbar. Die NS5A-spezifischen Antiseren fuhrten auBerdem zu einer schwachen Zellkern-Fluores- 
zenz, was darauf hindeutet, daB zumindest kleine Mengen dieses Antigens auch zum Zellkern gelangen. Die generell do- 30 
minierende Prasenz der viralen Antigene im Zytoplasma ist jedoch ein starkes Indiz dafur, daB die HCV-RNA Replika- 
tion im Zytoplasma stattfindet - so wie das bei den meisten RNA-Viren der Fall ist. 

Diese Ergebnisse belegen klar, daB mit dem hier beschriebenen Versuchsansatz der Aufbau eines Zellkultursystems 
fur das HCV gelungen ist, dessen Effizienz alles bisher bekannte um GroBenordnungen iibersteigl und erstmalig den 
Nachweis viraler Nukleinsauren und Proteine mit konventionellen und bewahrten biochemischen Methoden erlaubt. Erst 35 
diese Effizienz erlaubt uberhaupt detaillierte Untersuchungen der HC V-Pathogenese, genetische Analysen verschiedener 
HCV-Funktionen und ein genaues Studium der Virus-/Wirtszellwechselwirkungen, wodurch sich neuc Ansatzpunkte fiir 
die Entwicklung einer anti viralen Therapie dehnieren lassen. 

Beispiel 3 40 

Transfektion von Huh-7 Zellen mit HCV-Genomkonstrukten 

Huh-7 Zellen werden wie in Beispiel 2 beschrieben transfiziert und selektioniert, wobei hier jedoch selektionierbare 
Konstrukte verwendet werden, die das volistandige Virusgenom enthalten. Die erhaltenen Zellklone werden analog dem 45 
Beispiel 2 imttels PGR auf Abwesenheit von HCV-DNA untersucht und die produktive Replikation der HCV-RNA wird 
danach mittels Northern Blot, [ 3 H]Uridinmarkiening in Anwesenheit von Dactinomycin, Nachweis der viralen Proteine 
bzw. Antigene vorzugsweise mit Hilfe des Western Blots, der Immunoprazipitation oder der Immunfluoreszenz nachge- 
wiesen. Im Gegensatz zu den im Beispiel 2 beschriebenen Ansatzen lassen sich mit dem hier beschriebenen Konstrukt 
auBerdem volistandige und sehr wahrscheinlich infektiose Viren erhalten, was bei den dort (in Beispiel 2) beschriebenen 50 
Subgcnomkonstruktcn nicht der Fall ist. Diese Viren, die in der Zclle und dem Zcllkulturiiberstand vorhanden sind, wer- 
den bcispielsweisc mittels Ultrazentrifugation, Immunprazipitation oder Fallung mit Polycthylenglykol konzcntriert und 
alle cxogencn, d. h. nicht im Viruspartikcl cingebautcn Nukleinsauren werden mittels Inkubation mit Nuklcasen (RNasc, 
DNasc, Mikrococusnuklcase) verdaut. Auf diese Weise lassen sich alle kontaminicrenden Nukleinsauren, die nicht im 
schiitzenden Viruspartikel enthalten sind, entfemen. Die geschutzte virale RNA wird nach Tnaktivierung der Nukleasen, 55 
beispielsweise mittels Inkubation mit Proteinase K in einem SDS-haltigen Puffer durch Extraktion mit Phenol und Phe- 
nol/Chloroform isoliert und mittels Northern Blot oder RT-PCR unter Verwendung HCV-spezifischer Primer nachgewie- 
sen. Auch in diesem Versuchsansatz ist die Kombi nation des beschriebenen HCV-Konsensusgenoms mit. einem Selekti- 
onsmarker entscheidend fiir die efliziente Produktion von viraler RNA, viralem Protein und damit von HCV-Partikeln. 



Beispiel 4 

Hcrstcllung und Anwendung cincs HCV-RNA Konstrukts, bei dem das Rcsistcnzgen iibcr ein Ribozym bzw. cine Erkcn- 
nungsstelle fur ein Ribozym mit der HCV-Subgenom-Sequenz verbunden ist 

Es wird ein HCV-RNA-Konstrukt gcmaB Beispiel 1 oder Beispiel 3 hcrgcstcllt, bei dem ein Antibiotikumrcsistcnzgcn 
iibcr ein Ribozym bzw. cine Erkcnnungsstcllc fiir ein Ribozym mit der HCV-RNA-Scqucnz verbunden ist. Solchc Kon- 
strukte sind in Fig. 7 schematisch dargestellt. Huh-7 Zellen werden wie in Beispiel 2 beschrieben mit diesem HCV-RNA- 
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Konstrukt transfiziert. Nach der TYansfektion in die Zellen erfolgt zunachst die Selektion mit dem entsprcchenden Anti- 
biotikum. In den dabei erhaltenen Zellklonen wird das einklonierte Ribozym aktiviert oder, im Fall eines Konstrukts, das 
eine Erkennungsstelle fiir ein Ribozym tragt, wird das Ribozym in die Zelle eingeschleust (z. B. mittels Transfektion ei- 
nes RibozymkonsLrukts oder Infektion mit einem viralen Expressions vektor, in den das enlsprechende Ribozym einge- 
5 setzt wurde). In beiden Fallen wird durch die ribozymvermiUelte Spaltung das Resistenzgen von der HCV-RNA-Sequenz 
abgelrennt. Das Ergebnis ist im Fall des HC V-Genom-Konstrukts ein authenlisches HC V-Genom ohne Resistenzgen, das 
zur Bildung authentischer infektioser Viruspartikel befahigt ist. Im Fall des HCV-Subgenom-Konstrukts entsteht ein 
HC V-Replikon ohne Resistenzgen. 

to Beispiel 5 

Kotransfektion eines HCV-RNA-Konstrukts mit einem separaten Luziferase-Transfektionskonstrukt 

Es wird ein HCV-RNA-Konstrukt gemaB Beispiel 1(A) oder Beispiel 3 oder Beispiel 4 hergestellt. Parallel dazu wird 

15 ein Transfektionskonstrukt hergestellt, welches das Luziferasegen umfaBt, wobei dieses Luziferasegen vermittels einer 
ersten Nukleotidsequenz, die fiir eine HCV-Protease- (z. B. NS3-Protease-)Spaltungsstelle kodiert, mit einer zweiten 
Nukleotidsequenz, die fiir ein anderes Protein oder einen Teil eines anderen Proteins kodiert, verbunden ist. HCV-RNA- 
Konstrukt und Transfektionskonstrukt werden in beliebige Wirtszellen, vorzugsweise Hepatomazellen, insbesondere 
Huh-7-Zellen, eingeschleust. Dies kann auf die in Beispiel 2 beschriebene Art und Weise geschehen. Das Produkt des 

20 modifizierten Luziferasegens ist ein Luziferase-Fusionsprotein, in dem die Luziferase auf Grund der Fusion mit dem 
Fremdanteil inaktiv ist. In transfizierten Zellen mit hoher HCV-Replikation wird das Fusionsprotein, das ja eine Schnitt- 
stelle fur eine HCV-Protease enthalt, gespalten und dainit die aktive Form der Luziferase freigesetzt, die sich durch lu- 
minometrische Messung bestimmen laBt. Wird die Replikation des HCV-RNA-Konstrukts gehemmt, wird das Fusions- 
protein nicht gespalten und keine aktive Luziferase freigesetzt. Infolgedessen ist die quantitative Bestimmung der Luzi- 

25 ferase ein MaB fur die Replikation des HCV-Subgenom-Konstrukts. Anstclle des Luziferasegens kann ebensogut ein an- 
deres Reportergen verwendct werden, das in analoger Weise modifiziert ist, so daB seine Expression von der Virusrepli- 
kation abhangt, obwohl dieses Reportergen nicht Bestandteil des HCV-Subgenom-Konstrukts ist. Es kann auch ein zcl- 
lulares Protein, welches durch die HCV-Proteine oder Nukleinsaure inaktiviert oder aktiviert wird, als sogenannter Sur- 
rogatmarker verwendet werden. In diesem Fall ist die Expression bzw. Aktivitat dieses Surrogatmarkers ein MaB fiir die 

30 Replikation der viralen DNA. 

Beispiel 6 

Herstellung von HCV-Subgenom-Konslrukten mit integrierten Fremdgenen zur Verwendung als leberzellspezifische 
35 Genfahren fur die Gentherapie 

Diese rckombinanten und selektionierbaren HCV-Subgenom-Konstrukte werden in trans-komplcmenticrende Hclfcr- 
zellinien transfiziert, d. h. in Zellinien, die induzierbar oder konstitutiv die fehlenden Funktionen (beispielsweise die 
Strukturproteine) exprimiercn. Zellklone, die ein funktionclles HCV-Subgenom-Konstrukt enthalten, lassen sich durch 

40 cntsprcchcndc Selektion etablieren. Die von der Wirtszelle exprimicrten Virus- Strukturproteine erlaubcn die Bildung 
von Viruspartikeln, in die die RNA der HCV-Subgenom-Konstrukte eingeschleust wird. Das Ergebnis sind also virus- 
ahnliche Partikel, die ein erfindungsgemaBes HCV-Subgenom-Konstrukt einschlieBlich des einklonierten Fremdgens 
enthalten und die dieses mittels Infektion auf andere Zellen iibertragen konnen. Ein Beispiel fiir ein solches Konstrukt ist 
in Fig. 8 dargestellt. Es besteht auch die Mbglichkeit, das hier beschriebene erfindungsgemaBe HCV-Subgenom-Kon- 

45 strukt mit inlegriertem Fremdgen direkt als Expressions vektor einzusetzen. Dabei wird analog dem vorgenannten Ver- 
fahren vorgegangen, allerdings mit dem Unterschied, daB ZeUinien transfiziert werden, die keine transkomplementieren- 
den Faktoren exprimieren. In diesem Fall dient das HCV-Konstrukt also lediglich als Expressionsvektor. 
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SEQUENZPROTOKOLL 

ALLGEMEINE ANGABEN: 

ANMELDER: 

NAME: Universitat Mainz 
STRASSE: Obere Zahlbacher Str. 67. . . 
ORT. Mainz 

BUNDESLAND: Rheinland-Pfalz 
LAND: Deutschland 
POSTLEITZAHL. 55101 

VERTRETER. 

NAME: Dr. Ulrike Rudolph 
STRASSE: In der Schanz 10 
ORT: Schriesheim 

BUNDESLAND: Baden- Wurttemberg 
LAND: Deutschland 
POSTLEITZAHL: 69198 
VERTRETERNUMMER. 246 263 
AKTENZEICHEN. 



TELEKOMMUNKATION: 

TELEFON: 06203-61348 
TELEFAX: 06203-64196 



BEZEICHNUNG DER ERFINDUNG: 

Hepatitis C Virus Zellkultursystem 



ANZAHL DER SEQUENZEN. 5 



COMPUTERLE SB ARE FASSUNG: 

DATENTRAGER: Diskette 
COMPUTER: PC 
BETRIEBSSYSTEM: MS DOS 
SOFTWARE. Word 6.0 fur windows 95 
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ANGABEN ZU SEQ ID-NO: 1 : 

SEQUENZCHARAKTERISTIKA: 
LANGE: 11076Basenpaare 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
io TOPOLOGIE. linear 

ART DES MOLEKULS: Genom-RNA 

is HYPOTHETISCH: Nein 

ANTI-SENSE: nein 

20 URSPRUNGLICHE HERKUNFT. 

ORGANISMUS: Hepatitis C Virus 
STAMM: Genotyp lb 
ENTWICKLUNG S STADIUM: — 
ZELLTYP: — 

UNMITTELB ARE HERKUNFT. 
30 Isolat aus humanen Leberzellen 

MERKMAL: 

NAME7SCHLUSSEL. kodierende Sequenz for Viruspartikel 
35 LAGE: — 

ERMITTLUNGSMETHODE: . experimentell 



40 



45 SEQUENZBESCHREIBUNG: SEQ ID-NO. 1 
l389/Core-3'/wt: 11076 bp 



50 


GCCAGCCCCC 


GATTGGGGGC 


GACACTCCAC 


CATAGATCAC 


TCCCCTGTGA 


50 


GGAACTACTG 


TCTTCACGCA 


GAAAGCGTCT 


AGCCATGGCG 


TTAGTATGAG 


100 




TGTCGTGCAG 


CCTCCAGGAC 


CCCCCCTCCC 


GGGAGAGCCA 


TAGTGGTCTG 


150 


55 


CGGAACCGGT 


GAGTACACCG 


GAATTGCCAG 


GACGACCGGG TCCTTTCTTG 


200 




GATCAACCCG CTCAATGCCT GGAGATTTGG 


GCGTGCCCCC 


GCGAGACTGC 


250 


60 


TAGCCGAGTA 


GTGTTGGGTC 


GCGAAAGGCC 


TTGTGGTACT 


GCCTGATAGG 


300 




GTGCTTGCGA 


GTGCCCCGGG 


AGGTCTCGTA 


GACCGTGCAC 


CATGAGCACG 


350 


65 


AATCCTAAAC 


CTCAAAGAAA 


AACCAAACGT 


AACACCAACG GGCGCGCCAT 


400 




GATTGAACAA 


GATGGATTGC 


ACGCAGGTTC 


TCCGGCCGCT 


TGGGTGGAGA 


450 
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GGCTATTCGG CTATGACTGG GCACAACAGA CAATCGGCTG CTCTGATGCC 500 

GCCGTGTTCC GGCTGTCAGC GCAGGGGCGC CCGGTTCTTT TTGTCAAGAC 550 

CGACCTGTCC GGTGCCCTGA ATGAACTGCA GGACGAGGCA GCGCGGCTAT 600 

CGTGGCTGGC CACGACGGGC GTTCCTTGCG CAGCTGTGCT CGACGTTGTC 650 

ACTGAAGCGG GAAGGGACTG GCTGCTATTG GGCGAAGTGC CGGGGCAGGA 700 

TCTCCTGTCA TCTCACCTTG CTCCTGCCGA GAAAGTATCC ATCATGGCTG 750 

ATGCAATGCG GCGGCTGCAT ACGCTTGATC CGGCTACCTG CCCATTCGAC 800 

CACCAAGCGA AACATCGCAT CGAGCGAGCA CGTACTCGGA TGGAAGCCGG 850 

TCTTGTCGAT CAGGATGATC TGGACGAAGA GCATCAGGGG CTCGCGCCAG 900 

CCGAACTGTT CGCCAGGCTC AAGGCGCGCA TGCCCGACGG CGAGGATCTC 950 

GTCGTGACCC ATGGCGATGC CTGCTTGCCG AATATCATGG TGGAAAATGG 1000 

CCGCTTTTCT GGATTCATCG ACTGTGGCCG GCTGGGTGTG GCGGACCGCT 1050 

ATCAGGACAT AGCGTTGGCT ACCCGTGATA TTGCTGAAGA GCTTGGCGGC 1100 

GAATGGGCTG ACCGCTTCCT CGTGCTTTAC GGTATCGCCG CTCCCGATTC 1150 

GCAGCGCATC GCCTTCTATC GCCTTCTTGA CGAGTTCTTC TGAGTTTAAA 1200 

CAGACCACAA CGGTTTCCCT CTAGCGGGAT CAATTCCGCC CCTCTCCCTC 1250 

CCCCCCCCCT AACGTTACTG GCCGAAGCCG CTTGGAATAA GGCCGGTGTG 1300 

CGTTTGTCTA TATGTTATTT TCCACCATAT TGCCGTCTTT TGGCAATGTG 1350 

AGGGCCCGGA AACCTGGCCC TGTCTTCTTG ACGAGCATTC CTAGGGGTCT 1400 

TTCCCCTCTC GCCAAAGGAA TGCAAGGTCT GTTGAATGTC GTGAAGGAAG 1450 

CAGTTCCTCT GGAAGCTTCT TGAAGACAAA CAACGTCTGT AGCGACCCTT 1500 

TGCAGGCAGC GGAACCCCCC ACCTGGCGAC AGGTGCCTCT GCGGCCAAAA 1550 

GCCACGTGTA TAAGATACAC CTGCAAAGGC GGCACAACCC CAGTGCCACG 1600 

TTGTGAGTTG GATAGTTGTG GAAAGAGTCA AATGGCTCTC CTCAAGCGTA 1650 

TTCAACAAGG GGCTGAAGGA TGCCCAGAAG GTACCCCATT GTATGGGATC 1700 

TGATCTGGGG CCTCGGTGCA CATGCTTTAC ATGTGTTTAG TCGAGGTTAA 1750 

AAAACGTCTA GGCCCCCCGA ACCACGGGGA CGTGGTTTTC CTTTGAAAAA 1800 

CACGATAATA CCATGGGCAC GAATCCTAAA CCTCAAAGAA AAACCAAACG 1850 

TAACACCAAC CGCCGCCCAC AGGACGTCAA GTTCCCGGGC GGTGGTCAGA 1900 

TCGTCGGTGG AGTTTACCTG TTGCCGCGCA GGGGCCCCAG GTTGGGTGTG 1950 
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CGCGCGACTA GGAAGACTTC CGAGCGGTCG CAACCTCGTG GAAGGCGACA 2000 

ACCTATCCCC AAGGCTCGCC AGCCCGAGGG TAGGGCCTGG GCTCAGCCCG 2050 

5 

GGTACCCCTG GCCCCTCTAT GGCAATGAGG GCTTGGGGTG GGCAGGATGG 2100 

CTCCTGTCAC CCCGTGGCTC TCGGCCTAGT TGGGGCCCCA CGGACCCCCG 2150 

10 GCGTAGGTCG CGCAATTTGG GTAAGGTCAT CGATACCCTC ACGTGCGGCT 2200 

TCGCCGATCT CATGGGGTAC ATTCCGCTCG TCGGCGCCCC CCTAGGGGGC 2250 

is GCTGCCAGGG CCCTGGCGCA TGGCGTCCGG GTTCTGGAGG ACGGCGTGAA 2300 

CTATGCAACA GGGAATCTGC CCGGTTGCTC CTTTTCTATC TTCCTTTTGG 2350 

CTTTGCTGTC CTGTTTGACC ATCCCAGCTT CCGCTTATGA AGTGCGCAAC 2400 

20 

GTATCCGGAG TGTACCATGT CACGAACGAC TGCTCCAACG CAAGCATTGT 2450 

GTATGAGGCA GCGGACATGA TCATGCATAC CCCCGGGTGC GTGCCCTGCG 2500 

25 

TTCGGGAGAA CAACTCCTCC CGCTGCTGGG TAGCGCTCAC TCCCACGCTC 2550 

GCGGCCAGGA ACGCTAGCGT CCCCACTACG ACGATACGAC GCCATGTCGA 2600 

30 TTTGCTCGTT GGGGCGGCTG CTCTCTGCTC CGCTATGTAC GTGGGAGATC 2650 

TCTGCGGATC TGTTTTCCTC GTCGCCCAGC TGTTCACCTT CTCGCCTCGC 2700 

35 CGGCACGAGA CAGTACAGGA CTGCAATTGC TCAATATATC CCGGCCACGT 2750 

GACAGGTCAC CGTATGGCTT GGGATATGAT GATGAACTGG TCACCTACAG 2800 

CAGCCCTAGT GGTATCGCAG TTACTCCGGA TCCCACAAGC TGTCGTGGAT 2850 

40 

ATGGTGGCGG GGGCCCATTG GGGAGTCCTA GCGGGCCTTG CCTACTATTC 2900 

CATGGTGGGG AACTGGGCTA AGGTTCTGAT TGTGATGCTA CTCTTTGCCG 2950 

45 

GCGTTGACGG GGGAACCTAT GTGACAGGGG GGACGATGGC CAAAAACACC 3000 

CTCGGGATTA CGTCCCTCTT TTCACCCGGG TCATCCCAGA AAATCCAGCT 3050 

50 TGTAAACACC AACGGCAGCT GGCACATCAA CAGGACTGCC CTGAACTGCA 3100 

ATGACTCCCT CAACACTGGG TTCCTTGCTG CGCTGTTCTA CGTGCACAAG 3150 

55 TTCAACTCAT CTGGATGCCC AGAGCGCATG GCCAGCTGCA GCCCCATCGA 3200 

CGCGTTCGCT CAGGGGTGGG GGCCCATCAC TTACAATGAG TCACACAGCT 3250 

CGGACCAGAG GCCTTATTGT TGGCACTACG CACCCCGGCC GTGCGGTATC 3300 

60 

GTACCCGCGG CGCAGGTGTG TGGTCCAGTG TACTGCTTCA CCCCAAGCCC 3350 

TGTCGTGGTG GGGACGACCG ACCGGTTCGG CGTCCCTACG TACAGTTGGG 3400 

65 GGGAGAATGA GACGGACGTG CTGCTTCTTA ACAACACGCG GCCGCCGCAA 3450 
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GGCAACTGGT TTGGCTGTAC ATGGATGAAT AGCACTGGGT TCACCAAGAC 3500 

GTGCGGGGGC CCCCCGTGTA ACATCGGGGG GATCGGCAAT AAAACCTTGA 3550 

CCTGCCCCAC GGACTGCTTC CGGAAGCACC CCGAGGCCAC TTACACCAAG 3600 

TGTGGTTCGG GGCCTTGGTT GACACCCAGA TGCTTGGTCC ACTACCCATA 3650 

CAGGCTTTGG CACTACCCCT GCACTGTCAA CTTTACCATC TTCAAGGTTA 3700 

GGATGTACGT GGGGGGAGTG GAGCACAGGC TCGAAGCCGC ATGCAATTGG 3750 

ACTCGAGGAG AGCGTTGTAA CCTGGAGGAC AGGGACAGAT CAGAGCTTAG 3800 

CCCGCTGCTG CTGTCTACAA CGGAGTGGCA GGTATTGCCC TGTTCCTTCA 3850 

CCACCCTACC GGCTCTGTCC ACTGGTTTGA TCCATCTCCA TCAGAACGTC 3900 

GTGGACGTAC AATACCTGTA CGGTATAGGG TCGGCGGTTG TCTCCTTTGC 3950 

AATCAAATGG GAGTATGTCC TGTTGCTCTT CCTTCTTCTG GCGGACGCGC 4000 

GCGTCTGTGC CTGCTTGTGG ATGATGCTGC TGATAGCTCA AGCTGAGGCC 4050 

GCCCTAGAGA ACCTGGTGGT CCTCAACGCG GCATCCGTGG CCGGGGCGCA 4100 

TGGCATTCTC TCCTTCCTCG TGTTCTTCTG TGCTGCCTGG TACATCAAGG 4150 

GCAGGCTGGT CCCTGGGGCG GCATATGCCC TCTACGGCGT ATGGCCGCTA 4200 

CTCCTGCTCC TGCTGGCGTT ACCACCACGA GCATACGCCA TGGACCGGGA 4250 

GATGGCAGCA TCGTGCGGAG GCGCGGTTTT CGTAGGTCTG ATACTCTTGA 4300 

CCTTGTCACC GCACTATAAG CTGTTCCTCG CTAGGCTCAT ATGGTGGTTA 4350 

CAATATTTTA TCACCAGGGC CGAGGCACAC TTGCAAGTGT GGATCCCCCC 4400 

CCTCAACGTT CGGGGGGGCC GCGATGCCGT CATCCTCCTC ACGTGCGCGA 4450 

TCCACCCAGA GCTAATCTTT ACCATCACCA AAATCTTGCT CGCCATACTC 4500 

GGTCCACTCA TGGTGCTCCA GGCTGGTATA ACCAAAGTGC CGTACTTCGT 4550 

GCGCGCACAC GGGCTCATTC GTGCATGCAT GCTGGTGCGG AAGGTTGCTG 4600 

GGGGTCATTA TGTCCAAATG GCTCTCATGA AGTTGGCCGC ACTGACAGGT 4650 

ACGTACGTTT ATGACCATCT CACCCCACTG CGGGACTGGG CCCACGCGGG 4700 

CCTACGAGAC CTTGCGGTGG CAGTTGAGCC CGTCGTCTTC TCTGATATGG 4750 

AGACCAAGGT TATCACCTGG GGGGCAGACA CCGCGGCGTG TGGGGACATC 4800 

ATCTTGGGCC TGCCCGTCTC CGCCCGCAGG GGGAGGGAGA TACATCTGGG 4850 

ACCGGCAGAC AGCCTTGAAG GGCAGGGGTG GCGACTCCTC GCGCCTATTA 4 900 

CGGCCTACTC CCAACAGACG CGAGGCCTAC TTGGCTGCAT CATCACTAGC 4950 
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CTCACAGGCC GGGACAGGAA CCAGGTCGAG GGGGAGGTCC AAGTGGTCTC 5000 

CACCGCAACA CAATCTTTCC TGGCGACCTG CGTCAATGGC GTGTGTTGGA 5050 

5 

CTGTCTATCA TGGTGCCGGC TCAAAGACCC TTGCCGGCCC AAAGGGCCCA 5100 

ATCACCCAAA TGTACACCAA TGTGGACCAG GACCTCGTCG GCTGGCAAGC 5150 

10 GCCCCCCGGG GCGCGTTCCT TGACACCATG CACCTGCGGC AGCTCGGACC 5200 

TTTACTTGGT CACGAGGCAT GCCGATGTCA TTCCGGTGCG CCGGCGGGGC 5250 

15 GACAGCAGGG GGAGCCTACT CTCCCCCAGG CCCGTCTCCT ACTTGAAGGG 5300 

CTCTTCGGGC GGTCCACTGC TCTGCCCCTC GGGGCACGCT GTGGGCATCT 5350 

TTCGGGCTGC CGTGTGCACC CGAGGGGTTG CGAAGGCGGT GGACTTTGTA 5400 

20 

CCCGTCGAGT CTATGGAAAC CACTATGCGG TCCCCGGTCT TCACGGACAA 5450 

CTCGTCCCCT CCGGCCGTAC CGCAGACATT CCAGGTGGCC CATCTACACG 5500 

25 

CCCCTACTGG TAGCGGCAAG AGCACTAAGG TGCCGGCTGC GTATGCAGCC 5550 

CAAGGGTATA AGGTGCTTGT CCTGAACCCG TCCGTCGCCG CCACCCTAGG 5600 

30 XTTCGGGGCG TATATGTCTA AGGCACATGG TATCGACCCT AACATCAGAA 5650 

CCGGGGTAAG GACCATCACC ACGGGTGCCC CCATCACGTA CTCCACCTAT 5700 

35 GGCAAGTTTC TTGCCGACGG TGGTTGCTCT GGGGGCGCCT ATGACATCAT 5750 

AATATGTGAT GAGTGCCACT CAACTGACTC GACCACTATC CTGGGCATCG 5800 

GCACAGTCCT GGACCAAGCG GAGACGGCTG GAGCGCGACT CGTCGTGCTC 5850 

40 

GCCACCGCTA CGCCTCCGGG ATCGGTCACC GTGCCACATC CAAACATCGA 5900 

GGAGGTGGCT CTGTCCAGCA CTGGAGAAAT CCCCTTTTAT GGCAAAGCCA 5950 

45 

TCCCCATCGA GACCATCAAG GGGGGGAGGC ACCTCATTTT CTGCCATTCC 6000 

AAGAAGAAAT GTGATGAGCT CGCCGCGAAG CTGTCCGGCC TCGGACTCAA 6050 

50 TGCTGTAGCA TATTACCGGG GCCTTGATGT ATCCGTCATA CCAACTAGCG 6100 

GAGACGTCAT TGTCGTAGCA ACGGACGCTC TAATGACGGG CTTTACCGGC 6150 

55 GATTTCGACT CAGTGATCGA CTGCAATACA TGTGTCACCC AGACAGTCGA 6200 

CTTCAGCCTG GACCCGACCT TCACCATTGA GACGACGACC GTGCCACAAG 6250 

ACGCGGTGTC ACGCTCGCAG CGGCGAGGCA GGACTGGTAG GGGCAGGATG 6300 

60 

GGCATTTACA GGTTTGTGAC TCCAGGAGAA CGGCCCTCGG GCATGTTCGA 6350 

TTCCTCGGTT CTGTGCGAGT GCTATGACGC GGGCTGTGCT TGGTACGAGC 6400 

65 TCACGCCCGC CGAGACCTCA GTTAGGTTGC GGGCTTACCT AAACACACCA 6450 
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GGGTTGCCCG TCTGCCAGGA CCATCTGGAG TTCTGGGAGA GCGTCTTTAC 6500 

AGGCCTCACC CACATAGACG CCCATTTCTT GTCCCAGACT AAGCAGGCAG 6550 

GAGACAACTT CCCCTACCTG GTAGCATACC AGGCTACGGT GTGCGCCAGG 6600 

GCTCAGGCTC CACCTCCATC GTGGGACCAA ATGTGGAAGT GTCTCATACG 6650 

GCTAAAGCCT ACGCTGCACG GGCCAACGCC CCTGCTGTAT AGGCTGGGAG 6700 

CCGTTCAAAA CGAGGTTACT ACCACACACC CCATAACCAA ATACATCATG 6750 

GCATGCATGT CGGCTGACCT GGAGGTCGTC ACGAGCACCT GGGTGCTGGT 6800 

AGGCGGAGTC CTAGCAGCTC TGGCCGCGTA TTGCCTGACA ACAGGCAGCG 6850 

TGGTCATTGT GGGCAGGATC ATCTTGTCCG GAAAGCCGGC CATCATTCCC 6900 

GACAGGGAAG TCCTTTACCG GGAGTTCGAT GAGATGGAAG AGTGCGCCTC 6950 

ACACCTCCCT TACATCGAAC AGGGAATGCA GCTCGCCGAA CAATTCAAAC 7000 

AGAAGGCAAT CGGGTTGCTG CAAACAGCCA CCAAGCAAGC GGAGGCTGCT 7050 

GCTCCCGTGG TGGAATCCAA GTGGCGGACC CTCGAAGCCT TCTGGGCGAA 7100 

GCATATGTGG AATTTCATCA GCGGGATACA ATATJTTAGCA GGCTTGTCCA 7150 

CTCTGCCTGG CAACCCCGCG ATAGCATCAC TGATGGCATT CACAGCCTCT 7200 

ATCACCAGCC CGCTCACCAC CCAACATACC CTCCTGTTTA ACATCCTGGG 7250 

GGGATGGGTG GCCGCCCAAC TTGCTCCTCC CAGCGCTGCT TCTGCTTTCG 7300 

TAGGCGCCGG CATCGCTGGA GCGGCTGTTG GCAGCATAGG CCTTGGGAAG 7350 

GTGCTTGTGG ATATTTTGGC AGGTTATGGA GCAGGGGTGG CAGGCGCGCT 7400 

CGTGGCCTTT AAGGTCATGA GCGGCGAGAT GCCCTCCACC GAGGACCTGG 7450 

TTAACCTACT CCCTGCTATC CTCTCCCCTG GCGCCCTAGT CGTCGGGGTC 7500 

GTGTGCGCAG CGATACTGCG TCGGCACGTG GGCCCAGGGG AGGGGGCTGT 7550 

GCAGTGGATG AACCGGCTGA TAGCGTTCGC TTCGCGGGGT AACCACGTCT 7600 

CCCCCACGCA CTATGTGCCT GAGAGCGACG CTGCAGCACG TGTCACTCAG 7650 

ATCCTCTCTA GTCTTACCAT CACTCAGCTG CTGAAGAGGC TTCACCAGTG 7700 

GATCAACGAG GACTGCTCCA CGCCATGCTC CGGCTCGTGG CTAAGAGATG 7750 

TTTGGGATTG GATATGCACG GTGTTGACTG ATTTCAAGAC CTGGCTCCAG 7800 

TCCAAGCTCC TGCCGCGATT GCCGGGAGTC CCCTTCTTCT CATGTCAACG 7850 

TGGGTACAAG GGAGTCTGGC GGGGCGACGG CATCATGCAA ACCACCTGCC 7900 

CATGTGGAGC ACAGATCACC GGACATGTGA AAAACGGTTC CATGAGGATC 7950 
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GTGGGGCCTA GGACCTGTAG TAACACGTGG CATGGAACAT TCCCCATTAA 8000 

CGCGTACACC ACGGGCCCCT GCACGCCCTC CCCGGCGCCA AATTATTCTA 8050 

5 

GGGCGCTGTG GCGGGTGGCT GCTGAGGAGT ACGTGGAGGT TACGCGGGTG 8100 

GGGGATTTCC ACTACGTGAC GGGCATGACC ACTGACAACG TAAAGTGCCC 8150 

10 GTGTCAGGTT CCGGCCCCCG AATTCTTCAC AGAAGTGGAT GGGGTGCGGT 8200 

TGCACAGGTA CGCTCCAGCG TGCAAACCCC TCCTACGGGA GGAGGTCACA 8250 

15 TTCCTGGTCG GGCTCAATCA ATACCTGGTT GGGTCACAGC TCCCATGCGA 8300 

GCCCGAACCG GACGTAGCAG TGCTCACTTC CATGCTCACC GACCCCTCCC 8350 

ACATTACGGC GGAGACGGCT AAGCGTAGGC TGGCCAGGGG ATCTCCCCCC 8400 

20 

TCCTTGGCCA GCTCATCAGC TAGCCAGCTG TCTGCGCCTT CCTTGAAGGC 8450 

AACATGCACT ACCCGTCATG ACTCCCCGGA CGCTGACCTC ATCGAGGCCA 8500 

25 

ACCTCCTGTG GCGGCAGGAG ATGGGCGGGA ACATCACCCG CGTGGAGTCA 8550 

GAAAATAAGG TAGTAATTTT GGACTCTTTC GAGCCGCTCC AAGCGGAGGA 8600 

30 GGATGAGAGG GAAGTATCCG TTCCGGCGGA GATCCTGCGG AGGTCCAGGA 8650 

AATTCCCTCG AGCGATGCCC ATATGGGCAC GCCCGGATTA CAACCCTCCA 8700 

35 CTGTTAGAGT CCTGGAAGGA CCCGGACTAC GTCCCTCCAG TGGTACACGG 8750 

GTGTCCATTG CCGCCTGCCA AGGCCCCTCC GATACCACCT CCACGGAGGA 8800 

AGAGGACGGT TGTCCTGTCA GAATCTACCG TGTCTTCTGC CTTGGCGGAG 8850 

40 

CTCGCCACAA AGACCTTCGG CAGCTCCGAA TCGTCGGCCG TCGACAGCGG 8900 

CACGGCAACG GCCTCTCCTG ACCAGCCCTC CGACGACGGC GACGCGGGAT 8950 

45 

CCGACGTTGA GTCGTACTCC TCCATGCCCC CCCTTGAGGG GGAGCCGGGG 9000 

GATCCCGATC TCAGCGACGG GTCTTGGTCT ACCGTAAGCG AGGAGGCTAG 9050 

50 TGAGGACGTC GTCTGCTGCT CGATGTCCTA CACATGGACA GGCGCCCTGA 9100 

TCACGCCATG CGCTGCGGAG GAAACCAAGC TGCCCATCAA TGCACTGAGC 9150 

55 AACTCTTTGC TCCGTCACCA CAACTTGGTC TATGCTACAA CATCTCGCAG 9200 

CGCAAGCCTG CGGCAGAAGA AGGTCACCTT TGACAGACTG CAGGTCCTGG 9250 

ACGACCACTA CCGGGACGTG CTCAAGGAGA TGAAGGCGAA GGCGTCCACA 9300 

60 

GTTAAGGCTA AACTTCTATC CGTGGAGGAA GCCTGTAAGC TGACGCCCCC 9350 

ACATTCGGCC AGATCTAAAT TTGGCTATGG GGCAAAGGAC GTCCGGAACC 9400 

65 TATCCAGCAA GGCCGTTAAC CACATCCGCT CCGTGTGGAA GGACTTGCTG 9450 
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GAAGACACTG AGACACCAAT TGACACCACC 
TTTCTGCGTC CAACCAGAGA AGGGGGGCCG 
TATTCCCAGA TTTGGGGGTT CGTGTGTGCG 
GTGGTCTCCA CCCTCCCTCA GGCCGTGATG 
ATACTCTCCT GGACAGCGGG TCGAGTTCCT 
AGAAATGCCC TATGGGCTTC GCATATGACA 
GTCACTGAGA ATGACATCCG TGTTGAGGAG 
CTTGGCCCCC GAAGCCAGAC AGGCCATAAG 
ACATCGGGGG CCCCCTGACT AATTCTAAAG 
CGGTGCCGCG CGAGCGGTGT ACTGACGACC 
ATGTTACTTG AAGGCCGCTG CGGCCTGTCG 
GCACGATGCT CGTATGCGGA GACGACCTTG 
GGGACCCAAG AGGACGAGGC GAGCCTACGG 
TAGATACTCT GCCCCCCCTG GGGACCCGCC 
AGTTGATAAC ATCATGCTCC TCCAATGTGT 
GGCAAAAGGG TGTACTATCT CACCCGTGAC 
GGCTGCGTGG GAGACAGCTA GACACACTCC 
ACATCATCAT GTATGCGCCC ACCTTGTGGG 
CATTTCTTCT CCATCCTTCT AGCTCAGGAA 
TTGTCAGATC TACGGGGCCT GTTACTCCAT 
AGATCATTCA ACGACTCCAT GGCCTTAGCG 
TCTCCAGGTG AGATCAAT-AG GGTGGCTTCA 
ACCGCCCTTG CGAGTCTGGA GACATCGGGC 
TACTGTCCCA GGGGGGGAGG GCTGCCACTT 
TGGGCAGTAA GGACCAAGCT CAAACTCACT 
GTTGGATTTA TCCAGCTGGT TCGTTGCTGG 
ATCACAGCCT GTCTCGTGCC CGACCCCGCT 
CTACTTTCTG TAGGGGTAGG CATCTATCTA 
GAGCTAAACA CTCCAGGCCA ATAGGCCATC 
TTTTCTTTTT tttTTTTTTT «p'p»j<rj»'prpTTTT 
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ATCATGGCAA AAAATGAGGT 9500 

CAAGCCAGCT CGCCTTATCG 9550 

AGAAAATGGC CCTTTACGAT 9600 

GGCTCTTCAT ACGGATTCCA 9650 

GGTGAATGCC TGGAAAGCGA 9700 

CCCGCTGTTT TGACTCAACG 9750 

TCAATCTACC AATGTTGTGA 9800 

GTCGCTCACA GAGCGGCTTT 9850 

GGCAGAACTG CGGCTATCGC 9900 

AGCTGCGGTA ATACCCTCAC 9950 

AGCTGCGAAG CTCCAGGACT 10000 

TCGTTATCTG TGAAAGCGCG 10050 

GCCTTCACGG AGGCTATGAC 10100 

CAAACCAGAA TACGACTTGG 10150 

CAGTCGCGCA CGATGCATCT 10200 

CCCACCACCC CCCTTGCGCG 10250 

AGTCAATTCC TGGCTAGGCA 10300 

CAAGGATGAT CCTGATGACT 10350 

CAACTTGAAA AAGCCCTAGA 10400 

TGAGCCACTT GACCTACCTC 10450 

CATTTTCACT CCATAGTTAC 10500 

TGCCTCAGGA AACTTGGGGT 10550 

CAGAAGTGTC CGCGCTAGGC 10600 

GTGGCAAGTA CCTCTTCAAC 10650 

CCAATCCCGG CTGCGTCCCA 10700 

TTACAGCGGG GGAGACATAT 10750 

GGTTCATGTG GTGCCTACTC 10800 

CTCCCCAACC GATGAACGGG 10850 

CTGTTTTTTT CCCTTTTTTT 10900 

TTTTTTTTTC TCCTTTTTTT 10950 
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TTCCTCTTTT TTTCCTTTTC TTTCCTTTGG TGGCTCCATC TTAGCCCTAG 11000 
TCACGGCTAG CTGTGAAAGG TCCGTGAGCC GCTTGACTGC AGAGAGTGCT 11050 

5 

GATACTGGCC TCTCTGCAGA TCAAGT 

10 

is 

20 
25 
30 
35 
40 
45 
50 
55 
60 
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ANGABEN ZU SEQ ID-N0:2 : 

SEQUENZCHARAKTERISTIKA: 
LANGE: 8637 Basenpaare 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE linear 

ART DES MOLEKULS: Subgenom-RNA 

HYPOTHETISCH: Nein 

ANTI-SENSE; nein 



URSPRUNGLICHE HERKUNFT: 

ORGAN1SMUS: Hepatitis C Virus 
STAMM: Genotyp lb 
ENTWICKLUNGSSTADIUM: — 
ZELLTYP: — 

UNMTTELBARE HERKUNFT: 

Isolat aus humanen Leberzellen 



MERKMAL: 

NAME/SCHLUSSEL: kodierende Sequenz fur Virusproteine 
LAGE: — 

ERMITTLUNGSMETHODE: . experimentell 



SEQUENZBESCHREDBUNG: SEQ ID-NO: 2 

Ii^/NSa-S'/wt: 8637 bp 

GCCAGCCCCC GATTGGGGGC GACACTCCAC CATAGATCAC TCCCCTGTGA 

GGAACTACTG TCTTCACGCA GAAAGCGTCT AGCCATGGCG TTAGTATGAG 

TGTCGTGCAG CCTCCAGGAC CCCCCCTCCC GGGAGAGCCA TAGTGGTCTG 

CGGAACCGGT GAGTACACCG GAATTGCCAG GACGACCGGG TCCTTTCTTG 

GATCAACCCG CTCAATGCCT GGAGATTTGG GCGTGCCCCC GCGAGACTGC 

TAGCCGAGTA GTGTTGGGTC GCGAAAGGCC TTGTGGTACT GCCTGATAGG 

GTGCTTGCGA GTGCCCCGGG AGGTCTCGTA GACCGTGCAC CATGAGCACG 
AATCCTAAAC CTCAAAGAAA AACCAAAGGG CGCGCCATGA TTGAACAAGA 

TGGATTGCAC GCAGGTTCTC CGGCCGCTTG GGTGGAGAGG CTATTCGGCT 
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ATGACTGGGC ACAACAGACA ATCGGCTGCT CTGATGCCGC CGTGTTCCGG 500 

CTGTCAGCGC AGGGGCGCCC GGTTCTTTTT GTCAAGACCG ACCTGTCCGG 550 

5 

TGCCCTGAAT GAACTGCAGG ACGAGGCAGC GCGGCTATCG TGGCTGGCCA 600 

CGACGGGCGT TCCTTGCGCA GCTGTGCTCG ACGTTGTCAC TGAAGCGGGA 650 

10 AGGGACTGGC TGCTATTGGG CGAAGTGCCG GGGCAGGATC TCCTGTCATC 700 

TCACCTTGCT CCTGCCGAGA AAGTATCCAT CATGGCTGAT GCAATGCGGC 750 

15 GGCTGCATAC GCTTGATCCG GCTACCTGCC CATTCGACCA CCAAGCGAAA 800 

CATCGCATCG AGCGAGCACG TACTCGGATG GAAGCCGGTC TTGTCGATCA 850 

GGATGATCTG GACGAAGAGC ATCAGGGGCT CGCGCCAGCC GAACTGTTCG 900 

20 

CCAGGCTCAA GGCGCGCATG CCCGACGGCG AGGATCTCGT CGTGACCCAT 950 

GGCGATGCCT GCTTGCCGAA TATCATGGTG GAAAATGGCC GCTTTTCTGG 1000 

25 

ATTCATCGAC TGTGGCCGGC TGGGTGTGGC GGACCGCTAT CAGGACATAG 1050 

CGTTGGCTAC CCGTGATATT GCTGAAGAGC TTGGCGGCGA ATGGGCTGAC 1100 

30 CGCTTCCTCG TGCTTTACGG TATCGCCGCT CCCGATTCGC AGCGCATCGC 1150 

CTTCTATCGC CTTCTTGACG AGTTCTTCTG AGTTTAAACA GACCACAACG 1200 

35 GTTTCCCTCT AGCGGGATCA ATTCCGCCCC TCTCCCTCCC CCCCCCCTAA 1250 

CGTTACTGGC CGAAGCCGCT TGGAATAAGG CCGGTGTGCG TTTGTCTATA 1300 

TGTTATTTTC CACCATATTG CCGTCTTTTG GCAATGTGAG GGCCCGGAAA 1350 

40 

CCTGGCCCTG TCTTCTTGAC GAGCATTCCT AGGGGTCTTT CCCCTCTCGC 14 00 

CAAAGGAATG CAAGGTCTGT TGAATGTCGT GAAGGAAGCA GTTCCTCTGG 1450 

45 

AAGCTTCTTG AAGACAAACA ACGTCTGTAG CGACCCTTTG CAGGCAGCGG 1500 

AACCCCCCAC CTGGCGACAG GTGCCTCTGC GGCCAAAAGC CACGTGTATA 1550 

50 AGATACACCT GCAAAGGCGG CACAACCCCA GTGCCACGTT GTGAGTTGGA 1600 

TAGTTGTGGA AAGAGTCAAA TGGCTCTCCT CAAGCGTATT CAACAAGGGG 1650 

55 CTGAAGGATG CCCAGAAGGT ACCCCATTGT ATGGGATCTG ATCTGGGGCC 1700 

TCGGTGCACA TGCTTTACAT GTGTTTAGTC GAGGTTAAAA AACGTCTAGG 1750 

CCCCCCGAAC CACGGGGACG TGGTTTTCCT TTGAAAAACA CGATAATACC 1800 

60 

ATGGACCGGG AGATGGCAGC ATCGTGCGGA GGCGCGGTTT TCGTAGGTCT 1850 

GATACTCTTG ACCTTGTCAC CGCACTATAA GCTGTTCCTC GCTAGGCTCA 1900 

65 TATGGTGGTT ACAATATTTT ATCACCAGGG CCGAGGCACA CTTGCAAGTG 1950 
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TGGATCCCCC CCCTCAACGT TCGGGGGGGC CGCGATGCCG TCATCCTCCT 
CACGTGCGCG ATCCACCCAG AGCTAATCTT TACCATCACC AAAATCTTGC 
TCGCCATACT CGGTCCACTC ATGGTGCTCC AGGCTGGTAT AACCAAAGTG 
CCGTACTTCG TGCGCGCACA CGGGCTCATT CGTGCATGCA TGCTGGTGCG 
GAAGGTTGCT GGGGGTCATT ATGTCCAAAT GGCTCTCATG AAGTTGGCCG 
CACTGACAGG TACGTACGTT TATGACCATC TCACCCCACT GCGGGACTGG 
GCCCACGCGG GCCTACGAGA CCTTGCGGTG GCAGTTGAGC CCGTCGTCTT 
CTCTGATATG GAGACCAAGG TTATCACCTG GGGGGCAGAC ACCGCGGCGT 
GTGGGGACAT CATCTTGGGC CTGCCCGTCT CCGCCCGCAG GGGGAGGGAG 
ATACATCTGG GACCGGCAGA CAGCCTTGAA GGGCAGGGGT GGCGACTCCT 
CGCGCCTATT ACGGCCTACT CCCAACAGAC GCGAGGCCTA CTTGGCTGCA 
TCATCACTAG CCTCACAGGC CGGGACAGGA ACCAGGTCGA GGGGGAGGTC 
CAAGTGGTCT CCACCGCAAC ACAATCTTTC CTGGCGACCT GCGTCAATGG 
CGTGTGTTGG ACTGTCTATC ATGGTGCCGG CTCAAAGACC CTTGCCGGCC 
CAAAGGGCCC AATCACCCAA ATGTACACCA ATGTGGACCA GGACCTCGTC 
GGCTGGCAAG CGCCCCCCGG GGCGCGTTCC TTGACACCAT GCACCTGGGG 
CAGCTCGGAC CTTTACTTGG TCACGAGGCA TGCCGATGTC ATTCCGGTGC 
GCCGGCGGGG CGACAGCAGG GGGAGCCTAC TCTCCCCCAG GCCCGTCTCC 
TACTTGAAGG GCTCTTCGGG CGGTCCACTG CTCTGCCCCT CGGGGCACGC 
TGTGGGCATC TTTCGGGCTG CCGTGTGCAC CCGAGGGGTT GCGAAGGCGG 
TGGACTTTGT ACCCGTCGAG TCTATGGAAA CCACTATGCG GTCCCCGGTC 
TTCACGGACA ACTCGTCCCC TCCGGCCGTA CCGCAGACAT TCCAGGTGGC 
CCATCTACAC GCCCCTACTG GTAGCGGCAA GAGCACTAAG GTGCCGGCTG 
CGTATGCAGC CCAAGGGTAT AAGGTGCTTG TCCTGAACCC GTCCGTCGCC 
GCCACCCTAG GTTTCGGGGC GTATATGTCT AAGGCACATG GTATCGACCC 
TAACATCAGA ACCGGGGTAA GGACCATCAC CACGGGTGCC CCCATCACGT 
ACTCCACCTA TGGCAAGTTT CTTGCCGACG GTGGTTGCTC TGGGGGCGCC 
TATGACATCA TAATATGTGA TGAGTGCCAC TCAACTGACT CGACCACTAT 
CCTGGGCATC GGCACAGTCC TGGACCAAGC GGAGACGGCT GGAGCGCGAC 
TCGTCGTGCT CGCCACCGCT ACGCCTCCGG GATCGGTCAC CGTGCCACAT 
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CCAAACATCG AGGAGGTGGC TCTGTCCAGC ACT GG AG AAA TCCCCTTTTA 3500 

TGGCAAAGCC ATCCCCATCG AGACCATCAA GGGGGGGAGG CACCTCATTT 3550 

5 

TCTGCCATTC CAAGAAGAAA TGTGATGAGC TCGCCGCGAA GCTGTCCGGC 3600 

CTCGGACTCA ATGCTGTAGC ATATTACCGG GGCCTTGATG TATCCGTCAT 3650 

10 ACCAACTAGC GG AG ACGTC A TTGTCGTAGC AACGGACGCT CTAATGACGG 3700 

GCTTTACCGG CGATTTCGAC TCAGTGATCG ACTGCAATAC ATGTGTCACC 3750 

15 CAGACAGTCG ACTTCAGCCT GGACCCGACC TTCACCATTG AGACGACGAC 3800 

CGTGCCACAA GACGCGGTGT CACGCTCGCA GCGGCGAGGC AGGACTGGTA 3850 

GGGGCAGGAT GGGCATTTAC AGGTTTGTGA CTCCAGGAGA ACGGCCCTCG 3900 

20 

GGCATGTTCG ATTCCTCGGT TCTGTGCGAG TGCTATGACG CGGGCTGTGC 3950 

TTGGTACGAG CTCACGCCCG CCGAGACCTC AGTTAGGTTG CGGGCTTACC 4000 

25 

TAAACACACC AGGGTTGCCC GTCTGCCAGG ACCATCTGGA GTTCTGGGAG 4050 

AGCGTCTTTA CAGGCCTCAC CCACATAGAC GCCCATTTCT TGTCCCAGAC 4100 

TAAGCAGGCA GGAGACAACT TCCCCTACCT GGTAGCATAC CAGGCTACGG 4150 

TGTGCGCCAG GGCTCAGGCT CCACCTCCAT CGTGGGACCA AATGTGGAAG 4200 

35 TGTCTCATAC GGCTAAAGCC TACGCTGCAC GGGCCAACGC CCCTGCTGTA 4250 

TAGGCTGGGA GCCGTTCAAA ACGAGGTTAC TACCACACAC CCCATAACCA 4300 

AATACATCAT GGCATGCATG TCGGCTGACC TGGAGGTCGT CACGAGCACC 4350 

40 

TGGGTGCTGG TAGGCGGAGT CCTAGCAGCT CTGGCCGCGT ATTGCCTGAC 4400 

AACAGGCAGC GTGGTCATTG TGGGCAGGAT CATCTTGTCC GGAAAGCCGG 4 450 

45 

CCATCATTCC CGACAGGGAA GTCCTTTACC GGGAGTTCGA TGAGATGGAA 4500 

GAGTGCGCCT CACACCTCCC TTACATCGAA CAGGGAATGC AGCTCGCCGA 4550 

50 ACAATTCAAA CAGAAGGCAA TCGGGTTGCT GCAAACAGCC ACCAAGCAAG 4 600 

CGGAGGCTGC TGCTCCCGTG GTGGAATCCA AGTGGCGGAC CCTCGAAGCC 4 650 

55 TTCTGGGCGA AGCATATGTG GAATTTCATC AGCGGGATAC AATATTTAGC 4700 

AGGCTTGTCC ACTCTGCCTG GCAACCCCGC GATAGCATCA CTGATGGCAT 4750 

TCACAGCCTC TATCACCAGC CCGCTCACCA CCCAACATAC CCTCCTGTTT 4800 

60 

AACATCCTGG GGGGATGGGT GGCCGCCCAA CTTGCTCCTC CCAGCGCTGC 4850 

TTCTGCTTTC GTAGGCGCCG GCATCGCTGG AGCGGCTGTT GGCAGCATAG 4900 

65 GCCTTGGGAA GGTGCTTGTG GATATTTTGG CAGGTTATGG AGCAGGGGTG 4 950 
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GCAGGCGCGC TCGTGGCCTT TAAGGTCATG AGCGGCGAGA TGCCCTCCAC 5000 

CGAGGACCTG GTTAACCTAC TCCCTGCTAT CCTCTCCCCT GGCGCCCTAG 5050 

TCGTCGGGGT CGTGTGCGCA GCGATACTGC GTCGGCACGT GGGCCCAGGG 5100 

GAGGGGGCTG TGCAGTGGAT GAACCGGCTG ATAGCGTTCG CTTCGCGGGG 5150 

TAACCACGTC TCCCCCACGC ACTATGTGCC TGAGAGCGAC GCTGCAGCAC 5200 

GTGTCACTCA GATCCTCTCT AGTCTTACCA TCACTCAGCT GCTGAAGAGG 5250 

CTTCACCAGT GGATCAACGA GGACTGCTCC ACGCCATGCT CCGGCTCGTG 5300 

GCTAAGAGAT GTTTGGGATT GGATATGCAC GGTGTTGACT GATTTCAAGA 5350 

CCTGGCTCCA GTCCAAGCTC CTGCCGCGAT TGCCGGGAGT CCCCTTCTTC 5400 

TCATGTCAAC GTGGGTACAA GGGAGTCTGG CGGGGCGACG GCATCATGCA 5450 

AACCACCTGC CCATGTGGAG C AC AG AT C AC CGGACATGTG AAAAACGGTT 5500 

CCATGAGGAT CGTGGGGCCT AGGACCTGTA GTAACACGTG GCATGGAACA 5550 

TTCCCCATTA ACGCGTACAC CACGGGCCCC TGCACGCCCT CCCCGGCGCC 5600 

AAATTATTCT AGGGCGCTGT GGCGGGTGGC TGCTGAGGAG TACGTGGAGG 5650 

TTACGCGGGT GGGGGATTTC CACTACGTGA CGGGCATGAC CACTGACAAC 5700 

GTAAAGTGCC CGTGTCAGGT TCCGGCCCCC GAATTCTTCA CAGAAGTGGA 5750 

TGGGGTGCGG TTGCACAGGT ACGCTCCAGC GTGCAAACCC CTCCTACGGG 5800 

AGGAGGTCAC ATTCCTGGTC GGGCTCAATC AATACCTGGT TGGGTCACAG 5850 

CTCCCATGCG AGCCCGAACC GGACGTAGCA GTGCTCACTT CCATGCTCAC 5900 

CGACCCCTCC CACATTACGG CGGAGACGGC TAAGCGTAGG CTGGCCAGGG 5950 

GATCTCCCCC CTCCTTGGCC AGCTCATCAG CTAGCCAGCT GTCTGCGCCT 6000 

TCCTTGAAGG CAACATGCAC TACCCGTCAT GACTCCCCGG ACGCTGACCT 6050 

CATCGAGGCC AACCTCCTGT GGCGGCAGGA GATGGGCGGG AACATCACCC 6100 

GCGTGGAGTC AGAAAATAAG GTAGTAATTT TGGACTCTTT CGAGCCGCTC 6150 

CAAGCGGAGG AGGATGAGAG GGAAGTATCC GTTCCGGCGG AGATCCTGCG 6200 

GAGGTCCAGG AAATTCCCTC GAGCGATGCC CATATGGGCA CGCCCGGATT 6250 

ACAACCCTCC ACTGTTAGAG TCCTGGAAGG ACCCGGACTA CGTCCCTCCA 6300 

GTGGTACACG GGTGTCCATT GCCGCCTGCC AAGGCCCCTC CGATACCACC 6350 

TCCACGGAGG AAGAGGACGG TTGTCCTGTC AGAATCTACC GTGTCTTCTG 6400 

CCTTGGCGGA GCTCGCCACA AAGACCTTCG GCAGCTCCGA ATCGTCGGCC 6450 
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GTCGACAGCG GCACGGCAAC GGCCTCTCCT GACCAGCCCT CCGACGACGG 6500 

CGACGCGGGA TCCGACGTTG AGTCGTACTC CTCCATGCCC CCCCTTGAGG 6550 

5 

GGGAGCCGGG GGATCCCGAT CTCAGCGACG GGTCTTGGTC TACCGTAAGC 6600 

GAGGAGGCTA GTGAGGACGT CGTCTGCTGC TCGATGTCCT ACACATGGAC 6650 

10 AGGCGCCCTG ATCACGCCAT GCGCTGCGGA GGAAACCAAG CTGCCCATCA 6700 

ATGCACTGAG CAACTCTTTG CTCCGTCACC ACAACTTGGT CTATGCTACA 6750 

is ACATCTCGCA GCGCAAGCCT GCGGCAGAAG AAGGTCACCT TTGACAGACT 6800 

GCAGGTCCTG GACGACCACT ACCGGGACGT GCTCAAGGAG ATGAAGGCGA 6850 

AGGCGTCCAC AGTTAAGGCT AAACTTCTAT CCGTGGAGGA AGCCTGTAAG 6900 

20 

CTGACGCCCC CACATTCGGC CAGATCTAAA TTTGGCTATG GGGCAAAGGA 6950 

CGTCCGGAAC CTATCCAGCA AGGCCGTTAA CCACATCCGC TCCGTGTGGA 7000 

25 

AGGACTTGCT GGAAGACACT GAGACACCAA TTGACACCAC CATCATGGCA 7050 

AAAAATGAGG TTTTCTGCGT CCAACCAGAG AAGGGGGGCC GCAAGCCAGC 7100 

TCGCCTTATC GTATTCCCAG ATTTGGGGGT TCGTGTGTGC GAGAAAATGG 7150 

CCCTTTACGA TGTGGTCTCC ACCCTCCCTC AGGCCGTGAT GGGCTCTTCA 7200 

35 TACGGATTCC AATACTCTCC TGGACAGCGG GTCGAGTTCC TGGTGAATGC 7250 

CTGGAAAGCG AAGAAATGCC CTATGGGCTT CGCATATGAC ACCCGCTGTT 7300 

TTGACTCAAC GGTCACTGAG AATGACATCC GTGTTGAGGA GTCAATCTAC 7350 

40 

CAATGTTGTG ACTTGGCCCC CGAAGCCAGA CAGGCCATAA GGTCGCTCAC 7400 

AGAGCGGCTT TACATCGGGG GCCCCCTGAC TAATTCTAAA GGGCAGAACT 7 45 0 

45 

GCGGCTATCG CCGGTGCCGC GCGAGCGGTG TACTGACGAC CAGCTGCGGT 7500 

AATACCCTCA CATGTTACTT GAAGGCCGCT GCGGCCTGTC GAGCTGCGAA 7550 

50 GCTCCAGGAC TGCACGATGC TCGTATGCGG AGACGACCTT GTCGTTATCT 7600 

GTGAAAGCGC GGGGACCCAA GAGGACGAGG CGAGCCTACG GGCCTTCACG 7650 

55 GAGGCTATGA CTAGATACTC TGCCCCCCCT GGGGACCCGC CCAAACCAGA 7700 

ATACGACTTG GAGTTGATAA CATCATGCTC CTCCAATGTG TCAGTCGCGC 7750 

ACGATGCATC TGGCAAAAGG GTGTACTATC TCACCCGTGA CCCCACCACC 7800 

60 

CCCCTTGCGC GGGCTGCGTG GGAGACAGCT AGACACACTC CAGTCAATTC 7850 

CTGGCTAGGC AACATCATCA TGTATGCGCC CACCTTGTGG GCAAGGATGA 7900 

65 TCCTGATGAC TCATTTCTTC TCCATCCTTC TAGCTCAGGA ACAACTTGAA 7950 
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AAAGCCCTAG ATTGTCAGAT CTACGGGGCC TGTTACTCCA TTGAGCCACT 8000 

TGACCTACCT CAGATCATTC AACGACTCCA TGGCCTTAGC GCATTTTCAC 8050 

TCCATAGTTA CTCTCCAGGT GAGATCAATA GGGTGGCTTC ATGCCTCAGG 8100 

AAACTTGGGG TACCGCCCTT GCGAGTCTGG AGACATCGGG CCAGAAGTGT 8150 

CCGCGCTAGG CTACTGTCCC AGGGGGGGAG GGCTGCCACT TGTGGCAAGT 8200 

ACCTCTTCAA CTGGGCAGTA AGGACCAAGC TCAAACTCAC TCCAATCCCG 8250 

GCTGCGTCCC AGTTGGATTT ATCCAGCTGG TTCGTTGCTG GTTACAGCGG 8300 

GGGAGACATA TATCACAGCC TGTCTCGTGC CCGACCCCGC TGGTTCATGT 8350 

GGTGCCTACT CCTACTTTCT GTAGGGGTAG GCATCTATCT ACTCCCCAAC 8400 

CGATGAACGG GGAGCTAAAC ACTCCAGGCC AATAGGCCAT CCTGTTTTTT 8450 

TCCCTTTTTT TTTTTCTTTT TTTTTTTTTT TTTTTTTTTT TTTTTTTTTT 8500 

CTCCTTTTTT TTTCCTCTTT TTTTCCTTTT CTTTCCTTTG GTGGCTCCAT 8550 

CTTAGCCCTA GTCACGGCTA GCTGTGAAAG GTCCGTGAGC CGCTTGACTG 8600 
CAGAGAGTGC TGATACTGGC CTCTCTGCAG ATCAAGT 
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ANGABEN ZU SEQ ID-N0:3 : 

SEQUENZCHARAKTERISTIKA: 
LANGE: 8001 Basenpaare 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
10 TOPOLOGIE: linear 

ART DES MOLEKULS: Subgenom-RNA 

is HYPOTHETISCH: Nein 

ANTI-SENSE: nein 

20 URSPRUNGLICHE HERKUNFT: 

ORGANISMUS: Hepatitis C Virus 

STAMM: Genotyp lb 
25 ENTWICKLUNGSSTADrUM: — 

ZELLTYP: — 

UNM1TTELBARE HERKUNFT: 
30 Isolat aus humanen Leberzellen 

MERKMAL: 

NAME/SCHLUSSEL: kodierende Sequenz fur Virusproteine 
35 LAGE: — 

ERMITTLUNGSMETHODE: . experimentell 



40 



45 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 3 
5Q I 389 /NS3-3'/wt: 8001 bp 

GCCAGCCCCC GATTGGGGGC GACACTCCAC CATAGATCAC TCCCCTGTGA 50 

GGAACTACTG TCTTCACGCA GAAAGCGTCT AGCCATGGCG TTAGTATGAG 100 

55 

TGTCGTGCAG CCTCCAGGAC CCCCCCTCCC GGGAGAGCCA TAGTGGTCTG 150 

CGGAACCGGT GAGTACACCG GAATTGCCAG GACGACCGGG TCCTTTCTTG 200 

m GATCAACCCG CTCAATGCCT GGAGATTTGG GCGTGCCCCC GCGAGACTGC 250 

TAGCCGAGTA GTGTTGGGTC GCGAAAGGCC TTGTGGTACT GCCTGATAGG 300 

65 GTGCTTGCGA GTGCCCCGGG AGGTCTCGTA GACCGTGCAC CATGAGCACG 350 

AATCCTAAAC CTCAAAGAAA AACCAAACGT AACACCAACG GGCGCGCCAT 400 
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GATTGAACAA GATGGATTGC ACGCAGGTTC TCCGGCCGCT TGGGTGGAGA 450 

GGCTATTCGG CTATGACTGG GCACAACAGA CAATCGGCTG CTCTGATGCC 500 

GCCGTGTTCC GGCTGTCAGC GCAGGGGCGC CCGGTTCTTT TTGTCAAGAC 550 

CGACCTGTCC GGTGCCCTGA ATGAACTGCA GGACGAGGCA GCGCGGCTAT 600 

CGTGGCTGGC CACGACGGGC GTTCCTTGCG CAGCTGTGCT CGACGTTGTC 650 

ACTGAAGCGG GAAGGGACTG GCTGCTATTG GGCGAAGTGC CGGGGCAGGA 700 

TCTCCTGTCA TCTCACCTTG CTCCTGCCGA GAAAGTATCC ATCATGGCTG 750 

ATGCAATGCG GCGGCTGCAT ACGCTTGATC CGGCTACCTG CCCATTCGAC 800 

CACCAAGCGA AACATCGCAT CGAGCGAGCA CGTACTCGGA TGGAAGCCGG 850 

TCTTGTCGAT CAGGATGATC TGGACGAAGA GCATCAGGGG CTCGCGCCAG 900 

CCGAACTGTT CGCCAGGCTC AAGGCGCGCA TGCCCGACGG CGAGGATCTC 950 

GTCGTGACCC ATGGCGATGC CTGCTTGCCG AATATCATGG TGGAAAATGG 1000 

CCGCTTTTCT GGATTCATCG ACTGTGGCCG GCTGGGTGTG GCGGACCGCT 1050 

ATCAGGACAT AGCGTTGGCT ACCCGTGATA TTGCTGAAGA GCTTGGCGGC 1100 

GAATGGGCTG ACCGCTTCCT CGTGCTTTAC GGTATCGCCG CTCCCGATTC 1150 

GCAGCGCATC GCCTTCTATC GCCTTCTTGA CGAGTTCTTC TGAGTTTAAA 1200 

CAGACCACAA CGGTTTCCCT CTAGCGGGAT CAATTCCGCC CCTCTCCCTC 1250 

CCCCCCCCCT AACGTTACTG GCCGAAGCCG CTTGGAATAA GGCCGGTGTG 1300 

CGTTTGTCTA TATGTTATTT TCCACCATAT TGCCGTCTTT TGGCAATGTG 1350 

AGGGCCCGGA AACCTGGCCC TGTCTTCTTG ACGAGCATTC CTAGGGGTCT 1400 

TTCCCCTCTC GCCAAAGGAA TGCAAGGTCT GTTGAATGTC GTGAAGGAAG 1450 

CAGTTCCTCT GGAAGCTTCT TGAAGACAAA CAACGTCTGT AGCGACCCTT 1500 

TGCAGGCAGC GGAACCCCCC ACCTGGCGAC AGGTGCCTCT GCGGCCAAAA 1550 

GCCACGTGTA TAAGATACAC CTGCAAAGGC GGCACAACCC CAGTGCCACG 1600 

TTGTGAGTTG GATAGTTGTG GAAAGAGTCA AATGGCTCTC CTCAAGCGTA 1650 

TTCAACAAGG GGCTGAAGGA TGCCCAGAAG GTACCCCATT GTATGGGATC 1700 

TGATCTGGGG CCTCGGTGCA CATGCTTTAC ATGTGTTTAG TCGAGGTTAA 1750 

AAAACGTCTA GGCCCCCCGA ACCACGGGGA CGTGGTTTTC CTTTGAAAAA 1800 

CACGATAATA CCATGGCGCC TATTACGGCC TACTCCCAAC AGACGCGAGG 1850 

CCTACTTGGC TGCATCATCA CTAGCCTCAC AGGCCGGGAC AGGAACCAGG 1900 
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TCGAGGGGGA GGTCCAAGTG GTCTCCACCG CAACACAATC TTTCCTGGCG 1950 

ACCTGCGTCA ATGGCGTGTG TTGGACTGTC TATCATGGTG CCGGCTCAAA 2000 

5 

GACCCTTGCC GGCCCAAAGG GCCCAATCAC CCAAATGTAC ACCAATGTGG 2050 

ACCAGGACCT CGTCGGCTGG CAAGCGCCCC CCGGGGCGCG TTCCTTGACA 2100 

10 CCATGCACCT GCGGCAGCTC GGACCTTTAC TTGGTCACGA GGCATGCCGA 2150 

TGTCATTCCG GTGCGCCGGC GGGGCGACAG CAGGGGGAGC CTACTCTCCC 2200 

15 CCAGGCCCGT CTCCTACTTG AAGGGCTCTT CGGGCGGTCC ACTGCTCTGC 2250 

CCCTCGGGGC ACGCTGTGGG CATCTTTCGG GCTGCCGTGT GCACCCGAGG 2300 

GGTTGCGAAG GCGGTGGACT TTGTACCCGT CGAGTCTATG GAAACCACTA 2350 

20 

TGCGGTCCCC GGTCTTCACG GACAACTCGT CCCCTCCGGC CGTACCGCAG 2400 

ACATTCCAGG TGGCCCATCT ACACGCCCCT ACTGGTAGCG GCAAGAGCAC 2450 

25 

TAAGGTGCCG GCTGCGTATG CAGCCCAAGG GTATAAGGTG CTTGTCCTGA 2500 

ACCCGTCCGT CGCCGCCACC CTAGGTTTCG GGGCGTATAT GTCTAAGGCA 2550 

30 CATGGTATCG ACCCTAACAT CAGAACCGGG GTAAGGACCA TCACCACGGG 2600 

TGCCCCCATC ACGTACTCCA CCTATGGCAA GTTTCTTGCC GACGGTGGTT 2650 

35 GCTCTGGGGG CGCCTATGAC ATCATAATAT GTGATGAGTG CCACTCAACT 2700 

GACTCGACCA CTATCCTGGG CATCGGCACA GTCCTGGACC AAGCGGAGAC 2750 

GGCTGGAGCG CGACTCGTCG TGCTCGCCAC CGCTACGCCT CCGGGATCGG 2800 

40 

TCACCGTGCC ACATCCAAAC ATCGAGGAGG TGGCTCTGTC CAGCACTGGA 2850 

GAAATCCCCT TTTATGGCAA AGCCATCCCC ATCGAGACCA TCAAGGGGGG 2900 

45 

GAGGCACCTC ATTTTCTGCC ATTCCAAGAA GAAATGTGAT GAGCTCGCCG 2950 

CGAAGCTGTC CGGCCTCGGA CTCAATGCTG TAGCATATTA CCGGGGCCTT 3000 

50 GATGTATCCG TCATACCAAC TAGCGGAGAC GTCATTGTCG TAGCAACGGA 3050 

CGCTCTAATG ACGGGCTTTA CCGGCGATTT CGACTCAGTG ATCGACTGCA 3100 

55 ATACATGTGT CACCCAGACA GTCGACTTCA GCCTGGACCC GACCTTCACC 3150 

ATTGAGACGA CGACCGTGCC ACAAGACGCG GTGTCACGCT CGCAGCGGCG 3200 

AGGCAGGACT GGTAGGGGCA GGATGGGCAT TTACAGGTTT GTGACTCCAG 3250 

60 

GAGAACGGCC CTCGGGCATG TTCGATTCCT CGGTTCTGTG CGAGTGCTAT 3300 

GACGCGGGCT GTGCTTGGTA CGAGCTCACG CCCGCCGAGA CCTCAGTTAG 3350 

65 GTTGCGGGCT TACCTAAACA CACCAGGGTT GCCCGTCTGC CAGGACCATC 3400 
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TGGAGTTCTG GGAGAGCGTC 
TTCTTGTCCC AGACTAAGCA 
ATACCAGGCT ACGGTGTGCG 
ACCAAATGTG GAAGTGTCTC 
ACGCCCCTGC TGTATAGGCT 
ACACCCCATA ACCAAATACA 
TCGTCACGAG CACCTGGGTG 
GCGTATTGCC TGACAACAGG 
GTCCGGAAAG CCGGCCATCA 
TCGATGAGAT GGAAGAGTGC 
ATGCAGCTCG CCGAACAATT 
AGCCACCAAG CAAGCGGAGG 
GGACCCTCGA AGCCTTCTGG 
ATACAATATT TAGCAGGCTT 
ATCACTGATG GCATTCACAG 
ATACCCTCCT GTTTAACATC 
CCTCCCAGCG CTGCTTCTGC 
TGTTGGCAGC ATAGGCCTTG 
ATGGAGCAGG GGTGGCAGGC 
GAGATGCCCT CCACCGAGGA 
CCCTGGCGCC CTAGTCGTCG 
ACGTGGGCCC AGGGGAGGGG 
TTCGCTTCGC GGGGTAACCA 
CGACGCTGCA GCACGTGTCA 
AGCTGCTGAA GAGGCTTCAC 
TGCTCCGGCT CGTGGCTAAG 
GACTGATTTC AAGACCTGGC 
GAGTCCCCTT CTTCTCATGT 
GACGGCATCA TGCAAACCAC 
TGTGAAAAAC GGTTCCATGA 
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TTTACAGGCC TCACCCACAT AGACGCCCAT 3450 

GGCAGGAGAC AACTTCCCCT ACCTGGTAGC 3500 

CCAGGGCTCA GGCTCCACCT CCATCGTGGG 3550 

ATACGGCTAA AGCCTACGCT GCACGGGCCA 3600 

GGGAGCCGTT CAAAACGAGG TTACTACCAC 3650 

TCATGGCATG CATGTCGGCT GACCTGGAGG 3700 

CTGGTAGGCG GAGTCCTAGC AGCTCTGGCC 3750 

CAGCGTGGTC ATTGTGGGCA GGATCATCTT 3800 

TTCCCGACAG GGAAGTCCTT TACCGGGAGT 3850 

GCCTCACACC TCCCTTACAT CGAACAGGGA 3900 

CAAACAGAAG GCAATCGGGT TGCTGCAAAC 3950 

CTGCTGCTCC CGTGGTGGAA TCCAAGTGGC 4000 

GCGAAGCATA TGTGGAATTT CATCAGCGGG 4050 

GTCCACTCTG CCTGGCAACC CCGCGATAGC 4100 

CCTCTATCAC CAGCCCGCTC ACCACCCAAC 4150 

CTGGGGGGAT GGGTGGCCGC CCAACTTGCT 4200 

TTTCGTAGGC GCCGGCATCG CTGGAGCGGC 4250 

GGAAGGTGCT TGTGGATATT TTGGCAGGTT 4300 

GCGCTCGTGG CCTTTAAGGT CATGAGCGGC 4350 

CCTGGTTAAC CTACTCCCTG CTATCCTCTC 4400 

GGGTCGTGTG CGCAGCGATA CTGCGTCGGC 4 450 

GCTGTGCAGT GGATGAACCG GCTGATAGCG 4500 

CGTCTCCCCC ACGCACTATG TGCCTGAGAG 4550 

CTCAGATCCT CTCTAGTCTT ACCATCACTC 4600 

CAGTGGATCA ACGAGGACTG CTCCACGCCA 4650 

AGATGTTTGG GATTGGATAT GCACGGTGTT 4700 

TCCAGTCCAA GCTCCTGCCG CGATTGCCGG 4750 

CAACGTGGGT ACAAGGGAGT CTGGCGGGGC 4800 

CTGCCCATGT GGAGCACAGA TCACCGGACA 4850 

GGATCGTGGG GCCTAGGACC TGTAGTAACA 4 900 
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CGTGGCATGG AACATTCCCC ATTAACGCGT ACACCACGGG CCCCTGCACG 4950 

CCCTCCCCGG CGCCAAATTA TTCTAGGGCG CTGTGGCGGG TGGCTGCTGA 5000 

5 

GGAGTACGTG GAGGTTACGC GGGTGGGGGA TTTCCACTAC GTGACGGGCA 5050 

TGACCACTGA CAACGTAAAG TGCCCGTGTC AGGTTCCGGC CCCCGAATTC 5100 

10 TTCACAGAAG TGGATGGGGT GCGGTTGCAC AGGTACGCTC CAGCGTGCAA 5150 

ACCCCTCCTA CGGGAGGAGG TCACATTCCT GGTCGGGCTC AATCAATACC 5200 

15 TGGTTGGGTC ACAGCTCCCA TGCGAGCCCG AACCGGACGT AGCAGTGCTC 5250 

ACTTCCATGC TCACCGACCC CTCCCACATT ACGGCGGAGA CGGCTAAGCG 5300 

TAGGCTGGCC AGGGGATCTC CCCCCTCCTT GGCCAGCTCA TCAGCTAGCC 5350 

20 

AGCTGTCTGC GCCTTCCTTG AAGGCAACAT GCACTACCCG TCATGACTCC 5400 

CCGGACGCTG ACCTCATCGA GGCCAACCTC CTGTGGCGGC AGGAGATGGG 5450 

25 

CGGGAACATC ACCCGCGTGG AGTCAGAAAA TAAGGTAGTA ATTTTGGACT 5500 

CTTTCGAGCC GCTCCAAGCG GAGGAGGATG AGAGGGAAGT ATCCGTTCCG 5550 

30 GCGGAGATCC TGCGGAGGTC CAGGAAATTC CCTCGAGCGA TGCCCATATG 5600 

GGCACGCCCG GATTACAACC CTCCACTGTT AGAGTCCTGG AAGGACCCGG 5650 

35 ACTACGTCCC TCCAGTGGTA CACGGGTGTC CATTGCCGCC TGCCAAGGCC 5700 

CCTCCGATAC CACCTCCACG GAGGAAGAGG ACGGTTGTCC TGTCAGAATC 5750 

TACCGTGTCT TCTGCCTTGG CGGAGCTCGC CACAAAGACC TTCGGCAGCT 5800 

40 

CCGAATCGTC GGCCGTCGAC AGCGGCACGG CAACGGCCTC TCCTGACCAG 5850 

CCCTCCGACG ACGGCGACGC GGGATCCGAC GTTGAGTCGT ACTCCTCCAT 5900 

45 

GCCCCCCCTT GAGGGGGAGC CGGGGGATCC CGATCTCAGC GACGGGTCTT 5950 

GGTCTACCGT AAGCGAGGAG GCTAGTGAGG ACGTCGTCTG CTGCTCGATG 6000 

50 TCCTACACAT GGACAGGCGC CCTGATCACG CCATGCGCTG CGGAGGAAAC 6050 

CAAGCTGCCC ATCAATGCAC TGAGCAACTC TTTGCTCCGT CACCACAACT 6100 

55 TGGTCTATGC TACAACATCT CGCAGCGCAA GCCTGCGGCA GAAGAAGGTC 6150 

ACCTTTGACA GACTGCAGGT CCTGGACGAC CACTACCGGG ACGTGCTCAA 6200 

GGAGATGAAG GCGAAGGCGT CCACAGTTAA GGCTAAACTT CTATCCGTGG 6250 

60 

AGGAAGCCTG TAAGCTGACG CCCCCACATT CGGCCAGATC TAAATTTGGC 6300 

TATGGGGCAA AGGACGTCCG GAACCTATCC AGCAAGGCCG TTAACCACAT 6350 

65 CCGCTCCGTG TGGAAGGACT TGCTGGAAGA CACTGAGACA CCAATTGACA 6400 
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CCACCATCAT GGCAAAAAAT GAGGTTTTCT GCGTCCAACC AGAGAAGGGG 6450 

GGCCGCAAGC CAGCTCGCCT TATCGTATTC CCAGATTTGG GGGTTCGTGT 6500 

GTGCGAGAAA ATGGCCCTTT. ACGATGTGGT CTCCACCCTC CCTCAGGCCG 6550 

TGATGGGCTC TTCATACGGA TTCCAATACT CTCCTGGACA GCGGGTCGAG 6600 

TTCCTGGTGA ATGCCTGGAA AGCGAAGAAA TGCCCTATGG GCTTCGCATA 6650 

TGACACCCGC TGTTTTGACT CAACGGTCAC TGAGAATGAC ATCCGTGTTG 6700 

AGGAGTCAAT CTACCAATGT TGTGACTTGG CCCCCGAAGC CAGACAGGCC 6750 

ATAAGGTCGC TCACAGAGCG GCTTTACATC GGGGGCCCCC TGACTAATTC 6800 

TAAAGGGCAG AACTGCGGCT ATCGCCGGTG CCGCGCGAGC GGTGTACTGA 6850 

CGACCAGCTG CGGTAATACC CTCACATGTT ACTTGAAGGC CGCTGCGGCC 6900 

TGTCGAGCTG CGAAGCTCCA GGACTGCACG ATGCTCGTAT GCGGAGACGA 6950 

CCTTGTCGTT ATCTGTGAAA GCGCGGGGAC CCAAGAGGAC GAGGCGAGCC 7000 

TACGGGCCTT CACGGAGGCT ATGACTAGAT ACTCTGCCCC CCCTGGGGAC 7050 

CCGCCCAAAC CAGAATACGA CTTGGAGTTG ATAACATCAT GCTCCTCCAA 7100 

TGTGTCAGTC GCGCACGATG CATCTGGCAA AAGGGTGTAC TATCTCACCC 7150 

GTGACCCCAC CACCCCCCTT GCGCGGGCTG CGTGGGAGAC AGCTAGACAC 7200 

ACTCCAGTCA ATTCCTGGCT AGGCAACATC ATCATGTATG CGCCCACCTT 7250 

GTGGGCAAGG ATGATCCTGA TGACTCATTT CTTCTCCATC CTTCTAGCTC 7300 

AGGAACAACT TGAAAAAGCC CTAGATTGTC AGATCTACGG GGCCTGTTAC 7350 

TCCATTGAGC CACTTGACCT ACCTCAGATC ATTCAACGAC TCCATGGCCT 7400 

TAGCGCATTT TCACTCCATA GTTACTCTCC AGGTGAGATC AATAGGGTGG 7450 

CTTCATGCCT CAGGAAACTT GGGGTACCGC CCTTGCGAGT CTGGAGACAT 7500 

CGGGCCAGAA GTGTCCGCGC TAGGCTACTG TCCCAGGGGG GGAGGGCTGC 7550 

CACTTGTGGC AAGTACCTCT TCAACTGGGC AGTAAGGACC AAGCTCAAAC 7600 

TCACTCCAAT CCCGGCTGCG TCCCAGTTGG ATTTATCCAG CTGGTTCGTT 7650 

GCTGGTTACA GCGGGGGAGA CATATATCAC AGCCTGTCTC GTGCCCGACC 7700 

CCGCTGGTTC ATGTGGTGCC TACTCCTACT TTCTGTAGGG GTAGGCATCT 7750 

ATCTACTCCC CAACCGATGA ACGGGGAGCT AAACACTCCA GGCCAATAGG 7800 

CCATCCTGTT TTTTTCCCTT TTTTTTTTTC TTTTTTTTTT TTTTTTTTTT 7850 

TTTTTTTTTT TTTTCTCCTT TTTTTTTCCT CTTTTTTTCC TTTTCTTTCC 7900 
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TTTGGTGGCT CCATCTTAGC CCTAGTCACG GCTAGCTGTG AAAGGTCCGT 7950 
GAGCCGCTTG ACTGCAGAGA GTGCTGATAC TGGCCTCTCT GCAGATCAAG 8000 
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ANGABEN ZU SEQ ID-N04 : 

SEQUENZCHARAKTERISTDCA: 
LANGE: 7989 Basenpaare 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 

TOPOLOGIE: linear l0 
ART DES MOLEKULS: Subgenom-RNA 

HYPOTHETISCH: Nein 15 
ANTI-SENSE: nein 



URSPRUNGLICHE HERKUNFT: 

ORGANISMUS: Hepatitis C Virus 
STAMM: Genotyp lb 
ENTWICKLUNGS STADIUM: — 
ZELLTYP: — 



UNMITTELBARE HERKUNFT: 

Isolat aus humanen Leberzellen 



MERKMAL: 

NAME/SCHLUSSEL: kodierende Sequenz fur Virusproteine 

LAGE: — 35 

ERMITTLUNGSMETHODE: . experimentell 
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SEQUENZBESCHREIBUNG: SEQ ID-NO: 4 
I 3 7i/NS3-3'/wt: 7989 bp 

GCCAGCCCCC GATTGGGGGC GACACTCCAC CATAGATCAC TCCCCTGTGA 50 

GGAACTACTG TCTTCACGCA GAAAGCGTCT AGCCATGGCG TTAGTATGAG 100 

TGTCGTGCAG CCTCCAGGAC CCCCCCTCCC GGGAGAGCCA TAGTGGTCTG 150 

CGGAACCGGT GAGTACACCG GAATTGCCAG GACGACCGGG TCCTTTCTTG 200 

GATCAACCCG CTCAATGCCT GGAGATTTGG GCGTGCCCCC GCGAGACTGC 250 

TAGCCGAGTA GTGTTGGGTC GCGAAAGGCC TTGTGGTACT GCCTGATAGG 300 

GTGCTTGCGA GTGCCCCGGG AGGTCTCGTA GACCGTGCAC CATGAGCACG 350 

AATCCTAAAC CTCAAAGAAA AACCAAAGGG CGCGCCATGA TTGAACAAGA 400 
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TGGATTGCAC GCAGGTTCTC CGGCCGCTTG GGTGGAGAGG CTATTCGGCT 450 

ATGACTGGGC ACAACAGACA ATCGGCTGCT CTGATGCCGC CGTGTTCCGG 500 

5 

CTGTCAGCGC AGGGGCGCCC GGTTCTTTTT GTCAAGACCG ACCTGTCCGG 550 

TGCCCTGAAT GAACTGCAGG ACGAGGCAGC GCGGCTATCG TGGCTGGCCA 600 

10 CGACGGGCGT TCCTTGCGCA GCTGTGCTCG ACGTTGTCAC TGAAGCGGGA 650 

AGGGACTGGC TGCTATTGGG CGAAGTGCCG GGGCAGGATC TCCTGTCATC 700 

l5 TCACCTTGCT CCTGCCGAGA AAGTATCCAT CATGGCTGAT GCAATGCGGC 750 

GGCTGCATAC GCTTGATCCG GCTACCTGCC CATTCGACCA CCAAGCGAAA 800 

CATCGCATCG AGCGAGCACG TACTCGGATG GAAGCCGGTC TTGTCGATCA 850 

20 

GGATGATCTG GACGAAGAGC ATCAGGGGCT CGCGCCAGCC GAACTGTTCG 900 

CCAGGCTCAA GGCGCGCATG CCCGACGGCG AGGATCTCGT CGTGACCCAT 950 

25 

GGCGATGCCT GCTTGCCGAA TATCATGGTG GAAAATGGCC GCTTTTCTGG 1000 

ATTCATCGAC TGTGGCCGGC TGGGTGTGGC GGACCGCTAT CAGGACATAG 1050 

30 CGTTGGCTAC CCGTGATATT GCTGAAGAGC TTGGCGGCGA ATGGGCTGAC 1100 

CGCTTCCTCG TGCTTTACGG TATCGCCGCT CCCGATTCGC AGCGCATCGC 1150 

35 CTTCTATCGC CTTCTTGACG AGTTCTTCTG AGTTTAAACA GACCACAACG 1200 

GTTTCCCTCT AGCGGGATCA ATTCCGCCCC TCTCCCTCCC CCCCCCCTAA 1250 

CGTTACTGGC CGAAGCCGCT TGGAATAAGG CCGGTGTGCG TTTGTCTATA 1300 

40 

TGTTATTTTC CACCATATTG CCGTCTTTTG GCAATGTGAG GGCCCGGAAA 1350 

CCTGGCCCTG TCTTCTTGAC GAGCATTCCT AGGGGTCTTT CCCCTCTCGC 1400 

45 

CAAAGGAATG CAAGGTCTGT TGAATGTCGT GAAGGAAGCA GTTCCTCTGG 1450 

AAGCTTCTTG AAGACAAACA ACGTCTGTAG CGACCCTTTG CAGGCAGCGG 1500 

50 AACCCCCCAC CTGGCGACAG GTGCCTCTGC GGCCAAAAGC CACGTGTATA 1550 

AGATACACCT GCAAAGGCGG CACAACCCCA GTGCCACGTT GTGAGTTGGA 1600 

55 TAGTTGTGGA AAGAGTCAAA TGGCTCTCCT CAAGCGTATT CAACAAGGGG 1650 

CTGAAGGATG CCCAGAAGGT ACCCCATTGT ATGGGATCTG ATCTGGGGCC 1700 

TCGGTGCACA TGCTTTACAT GTGTTTAGTC GAGGTTAAAA AACGTCTAGG 1750 

60 

CCCCCCGAAC CACGGGGACG TGGTTTTCCT TTGAAAAACA CGATAATACC 1800 

ATGGCGCCTA TTACGGCCTA CTCCCAACAG ACGCGAGGCC TACTTGGCTG 1850 

65 CATC ATC ACT AGCCTCACAG GCCGGGACAG GAACCAGGTC GAGGGGGAGG 1900 
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TCCAAGTGGT CTCCACCGCA ACACAATCTT TCCTGGCGAC CTGCGTCAAT 1950 

GGCGTGTGTT GGACTGTCTA TCATGGTGCC GGCTCAAAGA CCCTTGCCGG 2000 

CCCAAAGGGC CCAATCACCC AAATGTACAC CAATGTGGAC CAGGACCTCG 2050 

TCGGCTGGCA AGCGCCCCCC GGGGCGCGTT CCTTGACACC ATGCACCTGC 2100 

GGCAGCTCGG ACCTTTACTT GGTCACGAGG CATGCCGATG TCATTCCGGT 2150 

GCGCCGGCGG GGCGACAGCA GGGGGAGCCT ACTCTCCCCC AGGCCCGTCT 2200 

CCTACTTGAA GGGCTCTTCG GGCGGTCCAC TGCTCTGCCC CTCGGGGCAC 2250 

GCTGTGGGCA TCTTTCGGGC TGCCGTGTGC ACCCGAGGGG TTGCGAAGGC 2300 

GGTGGACTTT GTACCCGTCG AGTCTATGGA AACCACTATG CGGTCCCCGG 2350 

TCTTCACGGA CAACTCGTCC CCTCCGGCCG TACCGCAGAC ATTCCAGGTG 2400 

GCCCATCTAC ACGCCCCTAC TGGTAGCGGC AAGAGCACTA AGGTGCCGGC 2450 

TGCGTATGCA GCCCAAGGGT ATAAGGTGCT TGTCCTGAAC CCGTCCGTCG 2500 

CCGCCACCCT AGGTTTCGGG GCGTATATGT CTAAGGCACA TGGTATCGAC 2550 

CCTAACATCA GAACCGGGGT AAGGACCATC ACCACGGGTG CCCCCATCAC 2600 

GTACTCCACC TATGGCAAGT TTCTTGCCGA CGGTGGTTGC TCTGGGGGCG 2650 

CCTATGACAT CATAATATGT GATGAGTGCC ACTCAACTGA CTCGACCACT 2700 

ATCCTGGGCA TCGGCACAGT CCTGGACCAA GCGGAGACGG CTGGAGCGCG 2750 

ACTCGTCGTG CTCGCCACCG CTACGCCTCC GGGATCGGTC ACCGTGCCAC 2800 

ATCCAAACAT CGAGGAGGTG GCTCTGTCCA GCACTGGAGA AATCCCCTTT 2850 

TATGGCAAAG CCATCCCCAT CGAGACCATC AAGGGGGGGA GGCACCTCAT 2900 

TTTCTGCCAT TCCAAGAAGA AATGTGATGA GCTCGCCGCG AAGCTGTCCG 2950 

GCCTCGGACT CAATGCTGTA GCATATTACC GGGGCCTTGA TGTATCCGTC 3000 

ATACCAACTA GCGGAGACGT CATTGTCGTA GCAACGGACG CTCTAATGAC 3050 

GGGCTTTACC GGCGATTTCG ACTCAGTGAT CGACTGCAAT ACATGTGTCA 3100 

CCCAGACAGT CGACTTCAGC CTGGACCCGA CCTTCACCAT TGAGACGACG 3150 

ACCGTGCCAC AAGACGCGGT GTCACGCTCG CAGCGGCGAG GCAGGACTGG 3200 

TAGGGGCAGG ATGGGCATTT ACAGGTTTGT GACTCCAGGA GAACGGCCCT 3250 

CGGGCATGTT CGATTCCTCG GTTCTGTGCG AGTGCTATGA CGCGGGCTGT 3300 

GCTTGGTACG AGCTCACGCC CGCCGAGACC TCAGTTAGGT TGCGGGCTTA 3350 

CCTAAACACA CCAGGGTTGC CCGTCTGCCA GGACCATCTG GAGTTCTGGG 3400 
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AGAGCGTCTT TACAGGCCTC ACCCACATAG ACGCCCATTT CTTGTCCCAG 3450 

ACTAAGCAGG CAGGAGACAA CTTCCCCTAC CTGGTAGCAT ACCAGGCTAC 3500 

5 

GGTGTGCGCC AGGGCTCAGG CTCCACCTCC ATCGTGGGAC CAAATGTGGA 3550 

AGTGTCTCAT ACGGCTAAAG CCTACGCTGC ACGGGCCAAC GCCCCTGCTG 3600 

10 TATAGGCTGG GAGCCGTTCA AAACGAGGTT ACTACCACAC ACCCCATAAC 3650 

CAAATACATC ATGGCATGCA TGTCGGCTGA CCTGGAGGTC GTCACGAGCA 3700 

l5 CCTGGGTGCT GGTAGGCGGA GTCCTAGCAG CTCTGGCCGC GTATTGCCTG 3750 

ACAACAGGCA GCGTGGTCAT TGTGGGCAGG ATCATCTTGT CCGGAAAGCC 3800 

GGCCATCATT CCCGACAGGG AAGTCCTTTA CCGGGAGTTC GATGAGATGG 3850 

20 

AAGAGTGCGC CTCACACCTC CCTTACATCG AACAGGGAAT GCAGCTCGCC 3900 

GAACAATTCA AACAGAAGGC AATCGGGTTG CTGCAAACAG CCACCAAGCA 3950 

25 

AGCGGAGGCT GCTGCTCCCG TGGTGGAATC CAAGTGGCGG ACCCTCGAAG 4000 

CCTTCTGGGC GAAGCATATG TGGAATTTCA TCAGCGGGAT ACAATATTTA 4050 

30 GCAGGCTTGT CCACTCTGCC TGGCAACCCC GCGATAGCAT CACTGATGGC 4100 

ATTCACAGCC TCTATCACCA GCCCGCTCAC CACCCAACAT ACCCTCCTGT 4150 

35 TTAACATCCT GGGGGGATGG GTGGCCGCCC AACTTGCTCC TCCCAGCGCT 4200 

GCTTCTGCTT TCGTAGGCGC CGGCATCGCT GGAGCGGCTG TTGGCAGCAT 4250 

AGGCCTTGGG AAGGTGCTTG TGGATATTTT GGCAGGTTAT GGAGCAGGGG 4300 

40 

TGGCAGGCGC GCTCGTGGCC TTTAAGGTCA TGAGCGGCGA GATGCCCTCC 4350 

ACCGAGGACC TGGTTAACCT ACTCCCTGCT ATCCTCTCCC CTGGCGCCCT 4400 

45 

AGTCGTCGGG GTCGTGTGCG CAGCGATACT GCGTCGGCAC GTGGGCCCAG 4450 

GGGAGGGGGC TGTGCAGTGG ATGAACCGGC TGATAGCGTT CGCTTCGCGG 4500 

50 GGTAACCACG TCTCCCCCAC GCACTATGTG CCTGAGAGCG ACGCTGCAGC 4550 

ACGTGTCACT CAGATCCTCT CTAGTCTTAC CATCACTCAG CTGCTGAAGA 4600 

55 GGCTTCACCA GTGGATCAAC GAGGACTGCT CCACGCCATG CTCCGGCTCG 4650 

TGGCTAAGAG ATGTTTGGGA TTGGATATGC ACGGTGTTGA CTGATTTCAA 4700 

GACCTGGCTC CAGTCCAAGC TCCTGCCGCG ATTGCCGGGA GTCCCCTTCT 4750 

60 

TCTCATGTCA ACGTGGGTAC AAGGGAGTCT GGCGGGGCGA CGGCATCATG 4800 

CAAACCACCT GCCCATGTGG AGCACAGATC ACCGGACATG TGAAAAACGG 4850 

65 TTCCATGAGG ATCGTGGGGC CTAGGACCTG TAGTAACACG TGGCATGGAA 4 900 
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CATTCCCCAT TAACGCGTAC ACCACGGGCC CCTGCACGCC CTCCCCGGCG 4950 

CCAAATTATT CTAGGGCGCT GTGGCGGGTG GCTGCTGAGG AGTACGTGGA 5000 

GGTTACGCGG GTGGGGGATT TCCACTACGT GACGGGCATG ACCACTGACA 5050 

ACGTAAAGTG CCCGTGTCAG GTTCCGGCCC CCGAATTCTT CACAGAAGTG 5100 

GATGGGGTGC GGTTGCACAG GTACGCTCCA GCGTGCAAAC CCCTCCTACG 5150 

GGAGGAGGTC ACATTCCTGG TCGGGCTCAA TCAATACCTG GTTGGGTCAC 5200 

AGCTCCCATG CGAGCCCGAA CCGGACGTAG CAGTGCTCAC TTCCATGCTC 5250 

ACCGACCCCT CCCACATTAC GGCGGAGACG GCTAAGCGTA GGCTGGCCAG 5300 

GGGATCTCCC CCCTCCTTGG CCAGCTCATC AGCTAGCCAG CTGTCTGCGC 5350 

CTTCCTTGAA GGCAACATGC ACTACCCGTC ATGACTCCCC GGACGCTGAC 5400 

CTCATCGAGG CCAACCTCCT GTGGCGGCAG GAGATGGGCG GGAACATCAC 5450 

CCGCGTGGAG TCAGAAAATA AGGTAGTAAT TTTGGACTCT TTCGAGCCGC 5500 

TCCAAGCGGA GGAGGATGAG AGGGAAGTAT CCGTTCCGGC GGAGATCCTG 5550 

CGGAGGTCCA GGAAATTCCC TCGAGCGATG CCCATATGGG CACGCCCGGA 5600 

TTACAACCCT CCACTGTTAG AGTCCTGGAA GGACCCGGAC TACGTCCCTC 5650 

CAGTGGTACA CGGGTGTCCA TTGCCGCCTG CCAAGGCCCC TCCGATACCA 5700 

CCTCCACGGA GGAAGAGGAC GGTTGTCCTG TCAGAATCTA CCGTGTCTTC 5750 

TGCCTTGGCG GAGCTCGCCA CAAAGACCTT CGGCAGCTCC GAATCGTCGG 5800 

CCGTCGACAG CGGCACGGCA ACGGCCTCTC CTGACCAGCC CTCCGACGAC 5850 

GGCGACGCGG GATCCGACGT TGAGTCGTAC TCCTCCATGC CCCCCCTTGA 5900 

GGGGGAGCCG GGGGATCCCG ATCTCAGCGA CGGGTCTTGG TCTACCGTAA 5950 

GCGAGGAGGC TAGTGAGGAC GTCGTCTGCT GCTCGATGTC CTACACATGG 6000 

ACAGGCGCCC TGATCACGCC ATGCGCTGCG GAGGAAACCA AGCTGCCCAT 6050 

CAATGCACTG AGCAACTCTT TGCTCCGTCA CCACAACTTG GTCTATGCTA 6100 

CAACATCTCG CAGCGCAAGC CTGCGGCAGA AGAAGGTCAC CTTTGACAGA 6150 

CTGCAGGTCC TGGACGACCA CTACCGGGAC GTGCTCAAGG AGATGAAGGC 6200 

GAAGGCGTCC ACAGTTAAGG CTAAACTTCT ATCCGTGGAG GAAGCCTGTA 6250 

AGCTGACGCC CCCACATTCG GCCAGATCTA AATTTGGCTA TGGGGCAAAG 6300 

GACGTCCGGA ACCTATCCAG CAAGGCCGTT AACCACATCC GCTCCGTGTG 6350 

GAAGGACTTG CTGGAAGACA CTGAGACACC AATTGACACC ACCATCATGG 6400 



41 



DE 199 15 178 A 1 

CAAAAAATGA GGTTTTCTGC GTCCAACCAG AGAAGGGGGG CCGCAAGCCA 6450 

GCTCGCCTTA TCGTATTCCC AGATTTGGGG GTTCGTGTGT GCGAGAAAAT 6500 

5 

GGCCCTTTAC GATGTGGTCT CCACCCTCCC TCAGGCCGTG ATGGGCTCTT 6550 

CATACGGATT CCAATACTCT CCTGGACAGC GGGTCGAGTT CCTGGTGAAT 6600 

10 GCCTGGAAAG CGAAGAAATG CCCTATGGGC TTCGCATATG ACACCCGCTG 6650 

TTTTGACTCA ACGGTCACTG AGAATGACAT CCGTGTTGAG GAGTCAATCT 6700 

is ACCAATGTTG TGACTTGGCC CCCGAAGCCA GACAGGCCAT AAGGTCGCTC 6750 

ACAGAGCGGC TTTACATCGG GGGCCCCCTG ACTAATTCTA AAGGGCAGAA 6800 

CTGCGGCTAT CGCCGGTGCC GCGCGAGCGG TGTACTGACG ACCAGCTGCG 6850 

20 

GTAATACCCT CACATGTTAC TTGAAGGCCG CTGCGGCCTG TCGAGCTGCG 6900 

AAGCTCCAGG ACTGCACGAT GCTCGTATGC GGAGACGACC TTGTCGTTAT 6950 

25 

CTGTGAAAGC GCGGGGACCC AAGAGGACGA GGCGAGCCTA CGGGCCTTCA 7000 

CGGAGGCTAT GACTAGATAC TCTGCCCCCC CTGGGGACCC GCCCAAACCA 7050 

30 GAATACGACT TGGAGTTGAT AACATCATGC TCCTCCAATG TGTCAGTCGC 7100 

GCACGATGCA TCTGGCAAAA GGGTGTACTA TCTCACCCGT GACCCCACCA 7150 

35 CCCCCCTTGC GCGGGCTGCG TGGGAGACAG CTAGACACAC TCCAGTCAAT 7200 

TCCTGGCTAG GCAACATCAT CATGTATGCG CCCACCTTGT GGGCAAGGAT 7250 

GATCCTGATG ACTCATTTCT TCTCCATCCT TCTAGCTCAG GAACAACTTG 7300 

40 

AAAAAGCCCT AGATTGTCAG ATCTACGGGG CCTGTTACTC CATTGAGCCA 7350 

CTTGACCTAC CTCAGATCAT TCAACGACTC CATGGCCTTA GCGCATTTTC 7400 

45 

ACTCCATAGT TACTCTCCAG GTGAGATCAA TAGGGTGGCT TCATGCCTCA 7450 

GGAAACTTGG GGTACCGCCC TTGCGAGTCT GGAGACATCG GGCCAGAAGT 7500 

50 GTCCGCGCTA GGCTACTGTC CCAGGGGGGG AGGGCTGCCA CTTGTGGCAA 7550 

GTACCTCTTC AACTGGGCAG TAAGGACCAA GCTCAAACTC ACTCCAATCC 7600 

55 CGGCTGCGTC CCAGTTGGAT TTATCCAGCT GGTTCGTTGC TGGTTACAGC 7650 

GGGGGAGACA TATATCACAG CCTGTCTCGT GCCCGACCCC GCTGGTTCAT 7700 

GTGGTGCCTA CTCCTACTTT CTGTAGGGGT AGGCATCTAT CTACTCCCCA 7750 

60 

ACCGATGAAC GGGGAGCTAA ACACTCCAGG CCAATAGGCC ATCCTGTTTT 7800 

TTTCCCTTTT TTTTTTTCTT XTTTTTTTTT XTTTTTTTTT XTTTTTTTTT 7850 

65 TTCTCCTTTT TTTTTCCTCT TTTTTTCCTT TTCTTTCCTT TGGTGGCTCC 7900 



42 



DE 199 15 178 A 1 

ATCTTAGCCC TAGTCACGGC TAGCTGTGAA AGGTCCGTGA GCCGCTTGAC 7950 
TGCAGAGAGT GCTGATACTG GCCTCTCTGC AGATCAAGT 
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ANGABEN ZU SEQ ID-NO: 5 : 

SEQUENZCHARAKTERISTIKA: 
LANGE: 8649 Basenpaare 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
10 TOPOLOGIE: linear 

ART DES MOLEKULS: Subgenom-RNA 

15 HYPOTHETISCH: Nein 

ANTI-SENSE: nein 

20 URSPRUNGLICHE HERKUNFT: 

ORGANISMUS: Hepatitis C Virus 
STAMM: Genotyp lb 
ENTWICKLUNGSSTADIUM: — 
ZELLTYP: — 

UNMITTELBARE HERKUNFT: 
30 Isolat aus humanen Leberzellen 

MERKMAL: 

NAME/SCHLOSSEL: kodierende Sequenz fur Virusproteine 
35 LAGE: — 

ERMITTLUNGSMETHODE: . experimenteU 
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45 SEQUENZBESCHREmUNG: SEQ ID-NO: 5 
I 389 /NS2-3«/wt: 8649 bp 

50 GCCAGCCCCC GATTGGGGGC GACACTCCAC CATAGATCAC TCCCCTGTGA 50 

GGAACTACTG TCTTCACGCA GAAAGCGTCT AGCCATGGCG TTAGTATGAG 100 

55 TGTCGTGCAG CCTCCAGGAC CCCCCCTCCC GGGAGAGCCA TAGTGGTCTG 150 

CGGAACCGGT GAGTACACCG GAATTGCCAG GACGACCGGG TCCTTTCTTG 200 

GATCAACCCG CTCAATGCCT GGAGATTTGG GCGTGCCCCC GCGAGACTGC 250 

60 

TAGCCGAGTA GTGTTGGGTC GCGAAAGGCC TTGTGGTACT GCCTGATAGG 300 

GTGCTTGCGA GTGCCCCGGG AGGTCTCGTA GACCGTGCAC CATGAGCACG 350 

35 AATCCTAAAC CTCAAAGAAA AACCAAACGT AACACCAACG GGCGCGCCAT 400 
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GATTGAACAA GATGGATTGC ACGCAGGTTC TCCGGCCGCT TGGGTGGAGA 450 

GGCTATTCGG CTATGACTGG GCACAACAGA CAATCGGCTG CTCTGATGCC 500 

GCCGTGTTCC GGCTGTCAGC GCAGGGGCGC CCGGTTCTTT TTGTCAAGAC 550 

CGACCTGTCC GGTGCCCTGA ATGAACTGCA GGACGAGGCA GCGCGGCTAT 600 

CGTGGCTGGC CACGACGGGC GTTCCTTGCG CAGCTGTGCT CGACGTTGTC 650 

ACTGAAGCGG GAAGGGACTG GCTGCTATTG GGCGAAGTGC CGGGGCAGGA 700 

TCTCCTGTCA TCTCACCTTG CTCCTGCCGA GAAAGTATCC ATCATGGCTG 750 

ATGCAATGCG GCGGCTGCAT ACGCTTGATC CGGCTACCTG CCCATTCGAC 800 

CACCAAGCGA AACATCGCAT CGAGCGAGCA CGTACTCGGA TGGAAGCCGG 850 

TCTTGTCGAT CAGGATGATC TGGACGAA^A GCATCAGGGG CTCGCGCCAG 900 

CCGAACTGTT CGCCAGGCTC AAGGCGCGCA TGCCCGACGG CGAGGATCTC 950 

GTCGTGACCC ATGGCGATGC CTGCTTGCCG AATATCATGG TGGAAAATGG 1000 

CCGCTTTTCT GGATTCATCG ACTGTGGCCG GCTGGGTGTG GCGGACCGCT 1050 

ATCAGGACAT AGCGTTGGCT ACCCGTGATA TTGCTGAAGA GCTTGGCGGC 1100 

GAATGGGCTG ACCGCTTCCT CGTGCTTTAC GGTATCGCCG CTCCCGATTC 1150 

GCAGCGCATC GCCTTCTATC GCCTTCTTGA CGAGTTCTTC TGAGTTTAAA 1200 

CAGACCACAA CGGTTTCCCT CTAGCGGGAT CAATTCCGCC CCTCTCCCTC 1250 

CCCCCCCCCT AACGTTACTG GCCGAAGCCG CTTGGAATAA GGCCGGTGTG 1300 

CGTTTGTCTA TATGTTATTT TCCACCATAT TGCCGTCTTT TGGCAATGTG 1350 

AGGGCCCGGA AACCTGGCCC TGTCTTCTTG ACGAGCATTC CTAGGGGTCT 1400 

TTCCCCTCTC GCCAAAGGAA TGCAAGGTCT GTTGAATGTC GTGAAGGAAG 1450 

CAGTTCCTCT GGAAGCTTCT TGAAGACAAA CAACGTCTGT AGCGACCCTT 1500 

TGCAGGCAGC GGAACCCCCC ACCTGGCGAC AGGTGCCTCT GCGGCCAAAA 1550 

GCCACGTGTA TAAGATACAC CTGCAAAGGC GGCACAACCC CAGTGCCACG 1600 

TTGTGAGTTG GATAGTTGTG GAAAGAGTCA AATGGCTCTC CTCAAGCGTA 1650 

TTCAACAAGG GGCTGAAGGA TGCCCAGAAG GTACCCCATT GTATGGGATC 1700 

TGATCTGGGG CCTCGGTGCA CATGCTTTAC ATGTGTTTAG TCGAGGTTAA 1750 

AAAACGTCTA GGCCCCCCGA ACCACGGGGA CGTGGTTTTC CTTTGAAAAA 1800 

CACGATAATA CCATGGACCG GGAGATGGCA GCATCGTGCG GAGGCGCGGT 1850 

TTTCGTAGGT CTGATACTCT TGACCTTGTC ACCGCACTAT AAGCTGTTCC 1900 
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TCGCTAGGCT CATATGGTGG TTACAATATT TTATCACCAG GGCCGAGGCA 1950 

CACTTGCAAG TGTGGATCCC CCCCCTCAAC GTTCGGGGGG GCCGCGATGC 2000 

5 

CGTCATCCTC CTCACGTGCG CGATCCACCC AGAGCTAATC TTTACCATCA 2050 

CCAAAATCTT GCTCGCCATA CTCGGTCCAC TCATGGTGCT CCAGGCTGGT 2100 

10 ATAACCAAAG TGCCGTACTT CGTGCGCGCA CACGGGCTCA TTCGTGCATG 2150 

CATGCTGGTG CGGAAGGTTG CTGGGGGTCA TTATGTCCAA ATGGCTCTCA 2200 

is TGAAGTTGGC CGCACTGACA GGTACGTACG TTTATGACCA TCTCACCCCA 2250 

CTGCGGGACT GGGCCCACGC GGGCCTACGA GACCTTGCGG TGGCAGTTGA 2300 

GCCCGTCGTC TTCTCTGATA TGGAGACCAA GGTTATCACC TGGGGGGCAG 2350 

20 

ACACCGCGGC GTGTGGGGAC ATCATCTTGG GCCTGCCCGT CTCCGCCCGC 2400 

AGGGGGAGGG AGATACATCT GGGACCGGCA GACAGCCTTG AAGGGCAGGG 2450 

25 

GTGGCGACTC CTCGCGCCTA TTACGGCCTA CTCCCAACAG ACGCGAGGCC 2500 

TACTTGGCTG CATCATCACT AGCCTCACAG GCCGGGACAG GAACCAGGTC 2550 

30 GAGGGGGAGG TCCAAGTGGT CTCCACCGCA ACACAATCTT TCCTGGCGAC 2600 

CTGCGTCAAT GGCGTGTGTT GGACTGTCTA TCATGGTGCC GGCTCAAAGA 2650 

35 CCCTTGCCGG CCCAAAGGGC CCAATCACCC AAATGTACAC CAATGTGGAC 2700 

CAGGACCTCG TCGGCTGGCA AGCGCCCCCC GGGGCGCGTT CCTTGACACC 2750 

ATGCACCTGC GGCAGCTCGG ACCTTTACTT GGTCACGAGG CATGCCGATG 2800 

40 

TCATTCCGGT GCGCCGGCGG GGCGACAGCA GGGGGAGCCT ACTCTCCCCC 2850 

AGGCCCGTCT CCTACTTGAA GGGCTCTTCG GGCGGTCCAC TGCTCTGCCC 2900 

45 

CTCGGGGCAC GCTGTGGGCA TCTTTCGGGC TGCCGTGTGC ACCCGAGGGG 2950 

TTGCGAAGGC GGTGGACTTT GTACCCGTCG AGTCTATGGA AACCACTATG 3000 

50 CGGTCCCCGG TCTTCACGGA CAACTCGTCC CCTCCGGCCG TACCGCAGAC 3050 

ATTCCAGGTG GCCCATCTAC ACGCCCCTAC TGGTAGCGGC AAGAGCACTA 3100 

55 AGGTGCCGGC TGCGTATGCA GCCCAAGGGT ATAAGGTGCT TGTCCTGAAC 3150 

CCGTCCGTCG CCGCCACCCT AGGTTTCGGG GCGTATATGT CTAAGGCACA 3200 

TGGTATCGAC CCTAACATCA GAACCGGGGT AAGGACCATC ACCACGGGTG 3250 

60 

CCCCCATCAC GTACTCCACC TATGGCAAGT TTCTTGCCGA CGGTGGTTGC 3300 

TCTGGGGGCG CCTATGACAT CATAATATGT GATGAGTGCC ACTCAACTGA 3350 

65 

CTCGACCACT ATCCTGGGCA TCGGCACAGT CCTGGACCAA GCGGAGACGG 3400 
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CTGGAGCGCG ACTCGTCGTG CTCGCCACCG CTACGCCTCC GGGATCGGTC 3450 

ACCGTGCCAC ATCCAAACAT CGAGGAGGTG GCTCTGTCCA GCACTGGAGA 3500 

AATCCCCTTT TATGGCAAAG CCATCCCCAT CGAGACCATC AAGGGGGGGA 3550 

GGCACCTCAT TTTCTGCCAT TCCAAGAAGA AATGTGATGA GCTCGCCGCG 3600 

AAGCTGTCCG GCCTCGGACT CAATGCTGTA GCATATTACC GGGGCCTTGA 3650 

TGTATCCGTC ATACCAACTA GCGGAGACGT CATTGTCGTA GCAACGGACG 3700 

CTCTAATGAC GGGCTTTACC GGCGATTTCG ACTCAGTGAT CGACTGCAAT 3750 

ACATGTGTCA CCCAGACAGT CGACTTCAGC CTGGACCCGA CCTTCACCAT 3800 

TGAGACGACG ACCGTGCCAC AAGACGCGGT GTCACGCTCG CAGCGGCGAG 3850 

GCAGGACTGG TAGGGGCAGG ATGGGCATTT ACAGGTTTGT GACTCCAGGA 3900 

GAACGGCCCT CGGGCATGTT CGATTCCTCG GTTCTGTGCG AGTGCTATGA 3950 

CGCGGGCTGT GCTTGGTACG AGCTCACGCC CGCCGAGACC TCAGTTAGGT 4000 

TGCGGGCTTA CCTAAACACA CCAGGGTTGC CCGTCTGCCA GGACCATCTG 4050 

GAGTTCTGGG AGAGCGTCTT TACAGGCCTC ACCCACATAG ACGCCCATTT 4100 

CTTGTCCCAG ACTAAGCAGG CAGGAGACAA CTTCCCCTAC CTGGTAGCAT 4150 

ACCAGGCTAC GGTGTGCGCC AGGGCTCAGG CTCCACCTCC ATCGTGGGAC 4200 

CAAATGTGGA AGTGTCTCAT ACGGCTAAAG CCTACGCTGC ACGGGCCAAC 4250 

GCCCCTGCTG TATAGGCTGG GAGCCGTTCA AAACGAGGTT ACTACCACAC 4300 

ACCCCATAAC CAAATACATC ATGGCATGCA TGTCGGCTGA CCTGGAGGTC 4350 

GTCACGAGCA CCTGGGTGCT GGTAGGCGGA GTCCTAGCAG CTCTGGCCGC 4400 

GTATTGCCTG ACAACAGGCA GCGTGGTCAT TGTGGGCAGG ATCATCTTGT 4450 

CCGGAAAGCC GGCCATCATT CCCGACAGGG AAGTCCTTTA CCGGGAGTTC 4500 

GATGAGATGG AAGAGTGCGC CTCACACCTC CCTTACATCG AACAGGGAAT 4550 

GCAGCTCGCC GAACAATTCA AACAGAAGGC AATCGGGTTG CTGCAAACAG 4600 

CCACCAAGCA AGCGGAGGCT GCTGCTCCCG TGGTGGAATC CAAGTGGCGG 4650 

ACCCTCGAAG CCTTCTGGGC GAAGCATATG TGGAATTTCA TCAGCGGGAT 4700 

ACAATATTTA GCAGGCTTGT CCACTCTGCC TGGCAACCCC GCGATAGCAT 4750 

CACTGATGGC ATTCACAGCC TCTATCACCA GCCCGCTCAC CACCCAACAT 4800 

ACCCTCCTGT TTAACATCCT GGGGGGATGG GTGGCCGCCC AACTTGCTCC 4850 

TCCCAGCGCT GCTTCTGCTT TCGTAGGCGC CGGCATCGCT GGAGCGGCTG 4 900 
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TTGGCAGCAT AGGCCTTGGG AAGGTGCTTG TGGATATTTT GGCAGGTTAT 4 950 

GGAGCAGGGG TGGCAGGCGC GCTCGTGGCC TTTAAGGTCA TGAGCGGCGA 5000 

5 

GATGCCCTCC ACCGAGGACC TGGTTAACCT ACTCCCTGCT ATCCTCTCCC 5050 

CTGGCGCCCT AGTCGTCGGG GTCGTGTGCG CAGCGATACT GCGTCGGCAC 5100 

10 GTGGGCCCAG GGGAGGGGGC TGTGCAGTGG ATGAACCGGC TGATAGCGTT 5150 

CGCTTCGCGG GGTAACCACG TCTCCCCCAC GCACTATGTG CCTGAGAGCG 5200 

15 ACGCTGCAGC ACGTGTCACT CAGATCCTCT CTAGTCTTAC CATCACTCAG 5250 

CTGCTGAAGA GGCTTCACCA GTGGATCAAC GAGGACTGCT CCACGCCATG 5300 

CTCCGGCTCG TGGCTAAGAG ATGTTTGGGA TTGGATATGC ACGGTGTTGA 5350 

20 

CTGATTTCAA GACCTGGCTC CAGTCCAAGC TCCTGCCGCG ATTGCCGGGA 5400 

GTCCCCTTCT TCTCATGTCA ACGTGGGTAC AAGGGAGTCT GGCGGGGCGA 5450 

25 

CGGCATCATG CAAACCACCT GCCCATGTGG AGCACAGATC ACCGGACATG 5500 

TGAAAAACGG TTCCATGAGG ATCGTGGGGC CTAGGACCTG TAGTAACACG 5550 

30 TGGCATGGAA CATTCCCCAT TAACGCGTAC ACCACGGGCC CCTGCACGCC 5600 

CTCCCCGGCG CCAAATTATT CTAGGGCGCT GTGGCGGGTG GCTGCTGAGG 5650 

35 AGTACGTGGA GGTTACGCGG GTGGGGGATT TCCACTACGT GACGGGCATG 5700 

ACCACTGACA ACGTAAAGTG CCCGTGTCAG GTTCCGGCCC CCGAATTCTT 5750 

CACAGAAGTG GATGGGGTGC GGTTGCACAG GTACGCTCCA GCGTGCAAAC 5800 

40 

CCCTCCTACG GGAGGAGGTC ACATTCCTGG TCGGGCTCAA TCAATACCTG 5850 

GTTGGGTCAC AGCTCCCATG CGAGCCCGAA CCGGACGTAG CAGTGCTCAC 5900 

45 

TTCCATGCTC ACCGACCCCT CCCACATTAC GGCGGAGACG GCTAAGCGTA 5950 

GGCTGGCCAG GGGATCTCCC CCCTCCTTGG CCAGCTCATC AGCTAGCCAG 6000 

50 CTGTCTGCGC CTTCCTTGAA GGCAACATGC ACTACCCGTC ATGACTCCCC 6050 

GGACGCTGAC CTCATCGAGG CCAACCTCCT GTGGCGGCAG GAGATGGGCG 6100 

55 GGAACATCAC CCGCGTGGAG TCAGAAAATA AGGTAGTAAT TTTGGACTCT 6150 

TTCGAGCCGC TCCAAGCGGA GGAGGATGAG AGGGAAGTAT CCGTTCCGGC 6200 

GGAGATCCTG CGGAGGTCCA GGAAATTCCC TCGAGCGATG CCCATATGGG 6250 

60 

CACGCCCGGA TTACAACCCT CCACTGTTAG AGTCCTGGAA GGACCCGGAC 6300 

TACGTCCCTC CAGTGGTACA CGGGTGTCCA TTGCCGCCTG CCAAGGCCCC 6350 

65 TCCGATACCA CCTCCACGGA GGAAGAGGAC GGTTGTCCTG TCAGAATCTA 6400 



48 



DE 199 15 178 A 1 

CCGTGTCTTC TGCCTTGGCG GAGCTCGCCA CAAAGACCTT CGGCAGCTCC 6450 

GAATCGTCGG CCGTCGACAG CGGCACGGCA ACGGCCTCTC CTGACCAGCC 6500 

CTCCGACGAC GGCGACGCGG GATCCGACGT TGAGTCGTAC TCCTCCATGC 6550 

CCCCCCTTGA GGGGGAGCCG GGGGATCCCG ATCTCAGCGA CGGGTCTTGG 6600 

TCTACCGTAA GCGAGGAGGC TAGTGAGGAC GTCGTCTGCT GCTCGATGTC 6650 

CTACACATGG ACAGGCGCCC TGATCACGCC ATGCGCTGCG GAGGAAACCA 6700 

AGCTGCCCAT CAATGCACTG AGCAACTCTT TGCTCCGTCA CCACAACTTG 6750 

GTCTATGCTA CAACATCTCG CAGCGCAAGC CTGCGGCAGA AGAAGGTCAC 6800 

CTTTGACAGA CTGCAGGTCC TGGACGACCA CTACCGGGAC GTGCTCAAGG 6850 

AGATGAAGGC GAAGGCGTCC ACAGTTAAGG CTAAACTTCT ATCCGTGGAG 6900 

GAAGCCTGTA AGCTGACGCC CCCACATTCG GCCAGATCTA AATTTGGCTA 6950 

TGGGGCAAAG GACGTCCGGA ACCTATCCAG CAAGGCCGTT AACCACATCC 7000 

GCTCCGTGTG GAAGGACTTG CTGGAAGACA CTGAGACACC AATTGACACC 7050 

ACCATCATGG CAAAAAATGA GGTTTTCTGC GTCCAACCAG AGAAGGGGGG 7100 

CCGCAAGCCA GCTCGCCTTA TCGTATTCCC AGATTTGGGG GTTCGTGTGT 7150 

GCGAGAAAAT GGCCCTTTAC GATGTGGTCT CCACCCTCCC TCAGGCCGTG 7200 

ATGGGCTCTT CATACGGATT CCAATACTCT CCTGGACAGC GGGTCGAGTT 7250 

CCTGGTGAAT GCCTGGAAAG CGAAGAAATG CCCTATGGGC TTCGCATATG 7300 

ACACCCGCTG TTTTGACTCA ACGGTCACTG AGAATGACAT CCGTGTTGAG 7350 

GAGTCAATCT ACCAATGTTG TGACTTGGCC CCCGAAGCCA GACAGGCCAT 7400 

AAGGTCGCTC ACAGAGCGGC TTTACATCGG GGGCCCCCTG ACTAATTCTA 7450 

AAGGGCAGAA CTGCGGCTAT CGCCGGTGCC GCGCGAGCGG TGTACTGACG 7500 

ACCAGCTGCG GTAATACCCT CACATGTTAC TTGAAGGCCG CTGCGGCCTG 7550 

TCGAGCTGCG AAGCTCCAGG ACTGCACGAT GCTCGTATGC GGAGACGACC 7600 

TTGTCGTTAT CTGTGAAAGC GCGGGGACCC AAGAGGACGA GGCGAGCCTA 7650 

CGGGCCTTCA CGGAGGCTAT GACTAGATAC TCTGCCCCCC CTGGGGACCC 7700 

GCCCAAACCA GAATACGACT TGGAGTTGAT AACATCATGC TCCTCCAATG 7750 

TGTCAGTCGC GCACGATGCA TCTGGCAAAA GGGTGTACTA TCTCACCCGT 7800 

GACCCCACCA CCCCCCTTGC GCGGGCTGCG TGGGAGACAG CTAGACACAC 7850 

TCCAGTCAAT TCCTGGCTAG GCAACATCAT CATGTATGCG CCCACCTTGT 7900 
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5 



10 



20 



GGGCAAGGAT 


GATCCTGATG 


ACTCATTTCT 


TCTCCATCCT 


TCTAGCTCAG 


7950 


GAACAACTTG 


AAAAAGCCCT 


AGATTGTCAG 


ATCTACGGGG 


CCTGTTACTC 


8000 


CATTGAGCCA 


CTTGACCTAC 


CTCAGATCAT 


TCAACGACTC 


CATGGCCTTA 


8050 


GCGCATTTTC 


ACTCCATAGT 


TACTCTCCAG 


GTGAGATCAA 


TAGGGTGGCT 

X * X VJwV X 


8100 


TCATGCCTCA 


GGAAACTTGG 


GGTACCGCCC 


TTGCGAGTCT 


GGAGACATCG 


8150 


GGCCAGAAGT 


GTCCGCGCTA 


GGCTACTGTC 


CCAGGGGGGG 


AGGGCTGCCA 


8200 


CTTGTGGCAA 


GTACCTCTTC 


AACTGGGCAG 


TAAGGACCAA 


GCTCAAACTC 


8250 


ACTCCAATCC 


CGGCTGCGTC 


CCAGTTGGAT 


TTATCCAGCT 


GGTTPGTTGr 




TGGTTACAGC 


GGGGGAGACA 


TATATCACAG 


CCTGTCTCGT 






GCTGGTTCAT 


GTGGTGCCTA 


CTCCTACTTT 


CTGTAGGGGT 


AGftPATPTAT 




CTACTCCCCA 


ACCGATGAAC 


GGGGAGCTAA 


ACACTCCAGG 


C C AAT AGGCC 




ATCCTGTTTT 


TTTCCCTTTT 


TTTTTTTCTT 


TTTTTTTTTT 


TTTTTTTTTT 


8500 


TTTTTTTTTT 


TTCTCCTTTT 


TTTTTCCTCT 


TTTTTTCCTT 


TTCTTTCCTT 


8550 


TGGTGGCTCC 


ATCTTAGCCC 


TAGTCACGGC 


TAGCTGTGAA 


AGGTCCGTGA 


8600 


GCCGCTTGAC 


TGCAGAGAGT 


GCTGATACTG 


GCCTCTCTGC 


AGATCAAGT 





35 Patentanspriiche 

1. Hepatitis C Virus (HCV) Zellkultursystcm, das im wesentlichcn eukaryontische Zellen umfaBt, die cingcschleu- 
stes HCV-spezifisches Genmaterial enthalten, dadurch gekennzeichnet, daB die eukaryontischen Zellen humane 
Hepatomazcllen sind und daB das cingeschleuste HCV-spezifischc Genmaterial ein HCV-RNA-Konstrukt ist, das 

40 die HCV-spczifischcn RNA-Abschnitte 5TNFTR, NS3, NS4A, NS4B, NS5A, NS5B und 3'NTR und zusatzlich ein sc- 

lektierbares Markergen (Selektionsgen) umfaBt. 

2. Zellkultursystem nach Anspruch 1, dadurch gekennzeichnet, daB die Hepatomazcllen von einer handelsublichen 
Hepatomazellinie abstain men. 

3. Zellkultursystem nach Anspruch 1, dadurch gekennzeichnet, daB die Hepatomazellen aus einer Hepatomapri- 
45 marzellkulturgewonnen sind. 

4. HCV-RNA-Konstrukt, dadurch gekennzeichnet, daB es die HCV-spezifischen RNA-Abschnitte 5'NTR, NS3, 
NS4A, NS4B, NS5A, NS5B und 3'NTR umfaBt. 

5. HCV-RNA-Konstrukt nach Anspruch 4, dadurch gekennzeichnet, daB es die in Sequenzprotokoll SEQ ID NO: 1 
dargestellte Nukleotidsequenz umfaBt. 

50 6. HCV-RNA-Konstrukt nach Anspruch 4, dadurch gekennzeichnet, daB es die in Sequenzprotokoll SEQ ID NO: 2 

dargestellte Nukleotidsequenz umfaBt. 

7. HCV-RNA-Konstrukt nach Anspruch 4, dadurch gekennzeichnet, daB es die in Sequenzprotokoll SEQ ID NO: 3 
dargestellte Nukleotidsequenz umfaBt. 

8. HCV-RNA-Konstrukt nach Anspruch 4, dadurch gekennzeichnet, daB es die in Sequenzprotokoll SEQ ID NO: 4 
55 dargestellte Nukleotidsequenz umfaBt. 

9. HCV-RNA-Konstrukt nach Anspruch 4, dadurch gekennzeichnet, daB es die in Sequenzprotokoll SEQ ID NO: 5 
dargestellte Nukleotidsequenz umfaBt. 

10. HCV-RNA-Konstrukt nach Anspruch 4, dadurch gekennzeichnet, daB die 3'NTR eine Nukleotidsequenz auf- 
weist, die aus der Gruppe der nachfolgend aufgelisteten Nukleoudsequenzen (a) bis (i) ausgewahlt ist: 

60 
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(a) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTTTTT 
TTAGCTTTTTTTTTTTTCTTTTTTTTTGAGAGAGAGAGTCTCACTCTG 
TTGCCCAGACTGGAGT 

(b) AGGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTC TTTTTTTTGA GAGAGAGAGT 
CTCACTCTGT TGCCCAGACT GGAGC 

(c) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTAATCTTT TTTTTTTTCT TTTTTTTTGA GAGAGAGAGT 
CTCACTCTGT TGCCCAGACT GCAGC 

(d) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTAGTC TTTTTTTTTT TCTTTTTTTT TGAGAGAGAG 
AGTCTCACTC TGTTGCCCAG ACTGGAGT 

(e) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT TCTTTTTTTT TGAGAGAGAG 
AGTCTCACTC TGTTGCCCAG ACTGGAGT 

(f) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT TCTTTTTTTT TTGAGAGAGA 
GAGTCTCACT CTGTTGCCCA GACTGGAGT 

(g) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT CTTTTTTTTT GAGAGAGAGA 
GTCTCACTCT GTTGCCCAGA CTGGAGT 

(h) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTTAAT CTTTTTTTTT TTTTTCCTTT TTTTGAGAGA 
GAGAGTCTCA CTCTGTTGCC CAGACTGGAG T 

(i) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTAATC -nTTTTTTTT TTTTCTTTTT TTTTTGAGAG 
AGAGAGTCTC ACTCTGTTGC CCAGACTGGA GT 

11. HCV-RNA-Konstrukl nach einem der Anspriiche 4 bis 10, dadurch gekennzeichnet, daB das selektierbare Mar- 
kergen ein Resistenzgen und insbesondere eine Antibiotikaresistenzgen ist. 

12. HCV-RNA-Konstrukt nach einem der Anspriiche 4 bis 10, dadurch gekennzeichnet, daB das selektierbare Mar- 
kergen ein Ncomycinphosphotransferascgen ist. 

13. HCV-RNA-Konstrukt nach einem der Anspriiche 4 bis 12, dadurch gekennzeichnet, daB das selektierbare Mar- 
kergen strangabwarts der 5'NTR in die HCV-RNA integriert ist. 

14. HCV-RNA-Konstrukt nach einem der Anspriiche 4 bis 13, dadurch gekennzeichnet, daB das selektierbare Mar- 
kergen iiber ein Ribozym bzw. eine Erkennungsstelle fur ein Ribozym mit der HCV-RNA verbunden ist. 

15. HCV-RNA-Konstrukt. nach einem der Anspriiche 4 bis 14, dadurch gekennzeichnet, daB es ein integriertes Re- 
portergen aufweisl. 

16. HCV-RNA-Konstrukt. nach Anspruch 15, dadurch gekennzeichnet, daB das Reportergen ein Gen aus der 
Gruppe der Luziferasegene, dem CAT-Gen (Chloramphenicol- Acet ay l-Transferase-Gen), dem lacZ-Gen (beta-Ga- 
laktosidasegen), der GFP-Gene (green- fluorescence-protein-Gene), dem GUS-Gen (Glukuronidasegen) und dem 
SEAP-Gen (Sezernierte-Alkalische-Phosphatase-Gen) ist. 

17. HCV-RNA-Konstrukt nach einem der Anspriiche 4 bis 15, dadurch gekennzeichnet, daB deren Replikation die 
Expression cincs (zcllularcn) Surrogatmarkcrgcns bccinfluBt. 

18. HCV-RNA-Konstrukt nach einem der Anspriiche 15 bis 17, dadurch gekennzeichnet, daB das Resistenzgen 
derart in das offene Leseraster der HCV-RNA einidoniert ist, daB es erst nach einer proteolytischen Prozessierung in 
cine aktivc Form ubcrfuhrbar ist. 

19. HCV-RNA-Konstrukt nach einem der Anspriiche 15 bis 18, dadurch gekennzeichnet, daB das Reportergen und 
das selektierbare Markergen derart raumlich in dem Konstrukt angeordnet sind, daB sie gemeinsam ein Fusionspro- 



51 



DE 199 15 178 A 1 

tcin cxprimieren. 

20. Zellkultursystem nach einem der Anspruche 1 bis 3, dadurch gekennzeichnet, daB das HCV-RNA-Konstrukt 
ein Konstrukt gemaB wenigstens einem der Anspruche 4 bis 19 ist. 

21. Zellkultursystem nach Anspruch 1, dadurch gekennzeichnet, daB die das HCV-RNA-Konstrukt enthaltenden 
5 Zellen bei der DSMZ, Braunschweig, BRD, unter der Ilinterlegungsnuimner DSM ACC2394 (Laborbezeichnung 

HuBI 9-13) hinterlegt sind. 

22. Verwendung eines Zellkultursystems nach einem der Anspruche 1 bis 3 oder 20 bis 21 und/oder eines IICV- 
RNA-Konstrukts nach einem der Anspruche 4 bis 19 zur Herstellung und/oder Evaluierung und/oder 'lestung von 
Therapeutika und/oder Diagnostika zur Behandlung von insbesondere HCV-Infektionen. 

10 23. Verwendung eines Zellkultursystems nach einem der Anspruche 1 bis 3 oder 20 bis 21 und/oder eines HCV- 
RNA-Konstrukts nach einem der Anspruche 4 bis 19 zur Herstellung eines Impfstoffes gegen HCV-Infektionen. 

24. Verwendung eines HCV-RNA-Konstrukts nach einem der Anspruche 4 bis 19 zur Herstellung ciner lebcrzell- 
spezifischen Genfahrc fur die Genthcrapie. 

25. HCV-RNA-Konstrukt nach einem der Anspruche 4 bis 19, dadurch gekennzeichnet, daB es ein integrities 
15 Fremdgen aufweist und dazu geeignet. ist, dieses Fremdgen in eine Zielzelle einzuschleusen, die zur Expression die- 
ses Fremdgens geeignet ist. 
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